Explicar los diferentes tipos de conjuntos de caracteres disponibles en HTML

¿Explicar los diferentes tipos de conjuntos de caracteres disponibles en HTML?

Antes de ver los diferentes tipos de conjuntos de caracteres disponibles en HTML, primero sepamos qué conjuntos de caracteres en HTML son realmente.

Conjuntos de caracteres HTML: ¿Alguna vez se ha preguntado cómo el navegador muestra los números, alfabetos y otros símbolos con precisión? Es posible con la ayuda de un conjunto de caracteres en particular. 

¿Alguna vez te has preguntado cómo el navegador muestra números, alfabetos y otros símbolos con precisión? Es posible con la ayuda de un conjunto de caracteres en particular. 

Se especifica dentro de la etiqueta <meta>.

<meta charset="UTF-8">

Diferentes tipos de juegos de caracteres disponibles en HTML

Ha habido diferentes conjuntos de caracteres disponibles a lo largo del tiempo para la web. Comprendamos los diferentes tipos de conjuntos de caracteres disponibles en HTML.

ASCII: El primer formato de codificación de caracteres y el más común es ASCII ( Código estándar estadounidense para el intercambio de información ). ASCII ha definido 128 caracteres alfanuméricos diferentes que son números (0-9), alfabeto en minúsculas (az) y mayúsculas (AZ) y algunos caracteres especiales como + – $() @ etc. Representaba 128 caracteres diferentes ya que usaba solo 7 bits para almacenar caracteres. La desventaja de ASCII es que excluye las letras que no están en inglés.

Sintaxis:

<meta charset="ASCII">

La siguiente tabla muestra algunos de los 128 caracteres ASCII y sus números equivalentes:

        Carbonizarse                 Número                 Descripción        
  32 Espacio
! 33 marca exclamativa
“” 34 comillas
# 35 signo hash
ps 36 signo de dólar
% 37 Signo de porcentaje
& 38 ampersand
39 apóstrofe
( 40 paréntesis izquierdo
) 41 paréntesis derecho
* 42 Asterisco
2 50 Número 2
3 51 Numero 3
4 52 Número 4
sesenta y cinco A A mayúscula
66 B B mayúscula
75 k K mayúscula
89 Y Y mayúscula
90 Z Z mayúscula
97 a minúsculas
98 b b minúscula
107 k k minúscula
121 y minúscula
122 z minúscula z
126 ~ tilde

Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres ASCII y los caracteres se imprimen usando el juego de caracteres ASCII.

HTML

<!DOCTYPE html>
<html>
   
<head>
    <meta charset="ASCII">
    <title>ASCII character set</title>
    <link rel="stylesheet" href="style.css">
</head>
 
<body>
    <div>
         
<p>GeeksforGeeks</p>
 
         
<p>ASCII character set </p>
 
         
<p>! , [ , A </p>
 
    </div>
</body>
 
</html>

Producción:

 

ISO-8859-1: el conjunto de caracteres predeterminado utilizado en HTML4. Admitía 256 códigos de caracteres diferentes. La ISO (Organización Internacional de Normalización) define los conjuntos de caracteres estándar para diferentes idiomas/alfabetos. Es una extensión de ASCII con algunos caracteres internacionales adicionales. Para valores de 0 a 127, ISO-8859-1 es idéntico a ASCII y para valores de 160 a 255, es idéntico a UTF-8.

Nota: Los caracteres del 128 al 159 no están definidos en ISO-8859-1.

Sintaxis: 

<meta charset="ISO-8859-1">

La siguiente tabla muestra algunos de los caracteres ISO-8859-1 y sus números equivalentes:

        Personaje                 Nombre de la entidad                 Número de entidad                 Descripción        
¢ ¢avo;  ¢ centavo
¦ ¦ ¦ barra vertical rota
© &Copiar; © derechos de autor
® reg; ® marca registrada
¼ ¼ ¼ fracción 1/4
MI Ë MI e mayúscula, diéresis
a &una tumba; a a pequeña, acento grave
þ &espina; þ pequeña espina, islandés

Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres ISO-8859-1 y los caracteres se imprimen usando el juego de caracteres ISO-8859-1.

HTML

<!DOCTYPE html>
<html>
 
<head>
    <meta charset="ISO-8859-1">
    <title>ISO-8859-1 character set</title>
    <link rel="stylesheet" href="style.css">
</head>
 
<body>
    <div>
         
<p>GeeksforGeeks</p>
 
         
<p>ISO-8859-1 character set</p>
 
         
<p>Ë , ¦ , þ</p>
 
    </div>
</body>
 
</html>

Producción:

 

ANSI (Windows-1252): ANSI (Windows-1252) era el juego de caracteres predeterminado en Windows, hasta Windows95 y el juego de caracteres más popular también en Windows alrededor de 1985 a 1990. Es una extensión del juego de caracteres ASCII y casi idéntico a ISO-88591-1. Utiliza 8 bits ya que tiene que almacenar 256 caracteres diferentes. Este conjunto de caracteres es compatible con casi todos los navegadores.

Sintaxis:

<meta charset="ANSI">

La siguiente tabla muestra algunos de los caracteres ANSI (Windows-1252) y sus números equivalentes:

        Personaje                 Número                 Nombre de la entidad                 Descripción        
! 33   marca exclamativa
& 38 &erio; ampersand
0 48   cero digital
GRAMO 71   Letra mayúscula latina G
¼ 188 ¼ fracción vulgar un cuarto
© 169 &Copiar; signo de derechos de autor
þ 254 &espina; espina minúscula latina
ø 248 ø Letra latina minúscula 0 con trazo

Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres ANSI y los caracteres se imprimen usando el juego de caracteres ANSI.

HTML

<!DOCTYPE html>
<html>
   
<head>
    <meta charset="ANSI">
    <title>ANSI(Windows-1252) character set</title>
    <link rel="stylesheet" href="style.css">
</head>
 
<body>
    <div>
         
<p>GeeksforGeeks</p>
 
         
<p>ANSI(Windows-1252) character set</p>
 
        
<p>ø , ¼ , þ</p>
 
    </div>
</body>
 
</html>

Producción:

 

UTF-8:   El estándar Unicode fue desarrollado por el Consorcio Unicode principalmente UTF-8 y UTF-16. El problema con otros conjuntos de caracteres es que son limitados y no son compatibles en un entorno multilingüe. Contiene casi todos los caracteres, puntuación y símbolos. Se recomienda a los desarrolladores que utilicen el conjunto de caracteres UTF-8 de la especificación HTML5.

Sintaxis: 

<meta charset="UTF-8">

La siguiente tabla muestra algunos de los códigos de caracteres UTF-8 compatibles con HTML5:

          Códigos de caracteres                     hexadecimal                     Decimal          
Latín extendido-A 0100-017F 256-383
griego y copto 0370-03FF 88-1023
flechas 2190-21FF 8592-8703
Elementos de bloque 2580-259F 9600-9631

Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres UTF-8 y los caracteres se imprimen usando el juego de caracteres UTF-8.

HTML

<!DOCTYPE html>
<html>
   
<head>
    <meta charset="UTF-8">
    <title>UTF-8 character set</title>
    <link rel="stylesheet" href="style.css">
</head>
 
<body>
    <div>
         
<p>GeeksforGeeks</p>
 
         
<p>UTF-8 character set</p>
 
         
<p>Ͷ , ← , Ā </p>
 
    </div>
</body>
 
</html>

Producción:

 

Publicación traducida automáticamente

Artículo escrito por siddharthredhu01 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *