¿Explicar los diferentes tipos de conjuntos de caracteres disponibles en HTML?
Antes de ver los diferentes tipos de conjuntos de caracteres disponibles en HTML, primero sepamos qué conjuntos de caracteres en HTML son realmente.
Conjuntos de caracteres HTML: ¿Alguna vez se ha preguntado cómo el navegador muestra los números, alfabetos y otros símbolos con precisión? Es posible con la ayuda de un conjunto de caracteres en particular.
¿Alguna vez te has preguntado cómo el navegador muestra números, alfabetos y otros símbolos con precisión? Es posible con la ayuda de un conjunto de caracteres en particular.
Se especifica dentro de la etiqueta <meta>.
<meta charset="UTF-8">
Diferentes tipos de juegos de caracteres disponibles en HTML
Ha habido diferentes conjuntos de caracteres disponibles a lo largo del tiempo para la web. Comprendamos los diferentes tipos de conjuntos de caracteres disponibles en HTML.
ASCII: El primer formato de codificación de caracteres y el más común es ASCII ( Código estándar estadounidense para el intercambio de información ). ASCII ha definido 128 caracteres alfanuméricos diferentes que son números (0-9), alfabeto en minúsculas (az) y mayúsculas (AZ) y algunos caracteres especiales como + – $() @ etc. Representaba 128 caracteres diferentes ya que usaba solo 7 bits para almacenar caracteres. La desventaja de ASCII es que excluye las letras que no están en inglés.
Sintaxis:
<meta charset="ASCII">
La siguiente tabla muestra algunos de los 128 caracteres ASCII y sus números equivalentes:
Carbonizarse | Número | Descripción |
32 | Espacio | |
! | 33 | marca exclamativa |
“” | 34 | comillas |
# | 35 | signo hash |
ps | 36 | signo de dólar |
% | 37 | Signo de porcentaje |
& | 38 | ampersand |
‘ | 39 | apóstrofe |
( | 40 | paréntesis izquierdo |
) | 41 | paréntesis derecho |
* | 42 | Asterisco |
2 | 50 | Número 2 |
3 | 51 | Numero 3 |
4 | 52 | Número 4 |
sesenta y cinco | A | A mayúscula |
66 | B | B mayúscula |
75 | k | K mayúscula |
89 | Y | Y mayúscula |
90 | Z | Z mayúscula |
97 | a | minúsculas |
98 | b | b minúscula |
107 | k | k minúscula |
121 | y | minúscula |
122 | z | minúscula z |
126 | ~ | tilde |
Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres ASCII y los caracteres se imprimen usando el juego de caracteres ASCII.
HTML
<!DOCTYPE html> <html> <head> <meta charset="ASCII"> <title>ASCII character set</title> <link rel="stylesheet" href="style.css"> </head> <body> <div> <p>GeeksforGeeks</p> <p>ASCII character set </p> <p>! , [ , A </p> </div> </body> </html>
Producción:
ISO-8859-1: el conjunto de caracteres predeterminado utilizado en HTML4. Admitía 256 códigos de caracteres diferentes. La ISO (Organización Internacional de Normalización) define los conjuntos de caracteres estándar para diferentes idiomas/alfabetos. Es una extensión de ASCII con algunos caracteres internacionales adicionales. Para valores de 0 a 127, ISO-8859-1 es idéntico a ASCII y para valores de 160 a 255, es idéntico a UTF-8.
Nota: Los caracteres del 128 al 159 no están definidos en ISO-8859-1.
Sintaxis:
<meta charset="ISO-8859-1">
La siguiente tabla muestra algunos de los caracteres ISO-8859-1 y sus números equivalentes:
Personaje | Nombre de la entidad | Número de entidad | Descripción |
¢ | ¢avo; | ¢ | centavo |
¦ | ¦ | ¦ | barra vertical rota |
© | &Copiar; | © | derechos de autor |
® | reg; | ® | marca registrada |
¼ | ¼ | ¼ | fracción 1/4 |
MI | Ë | MI | e mayúscula, diéresis |
a | &una tumba; | a | a pequeña, acento grave |
þ | &espina; | þ | pequeña espina, islandés |
Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres ISO-8859-1 y los caracteres se imprimen usando el juego de caracteres ISO-8859-1.
HTML
<!DOCTYPE html> <html> <head> <meta charset="ISO-8859-1"> <title>ISO-8859-1 character set</title> <link rel="stylesheet" href="style.css"> </head> <body> <div> <p>GeeksforGeeks</p> <p>ISO-8859-1 character set</p> <p>Ë , ¦ , þ</p> </div> </body> </html>
Producción:
ANSI (Windows-1252): ANSI (Windows-1252) era el juego de caracteres predeterminado en Windows, hasta Windows95 y el juego de caracteres más popular también en Windows alrededor de 1985 a 1990. Es una extensión del juego de caracteres ASCII y casi idéntico a ISO-88591-1. Utiliza 8 bits ya que tiene que almacenar 256 caracteres diferentes. Este conjunto de caracteres es compatible con casi todos los navegadores.
Sintaxis:
<meta charset="ANSI">
La siguiente tabla muestra algunos de los caracteres ANSI (Windows-1252) y sus números equivalentes:
Personaje | Número | Nombre de la entidad | Descripción |
! | 33 | marca exclamativa | |
& | 38 | &erio; | ampersand |
0 | 48 | cero digital | |
GRAMO | 71 | Letra mayúscula latina G | |
¼ | 188 | ¼ | fracción vulgar un cuarto |
© | 169 | &Copiar; | signo de derechos de autor |
þ | 254 | &espina; | espina minúscula latina |
ø | 248 | ø | Letra latina minúscula 0 con trazo |
Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres ANSI y los caracteres se imprimen usando el juego de caracteres ANSI.
HTML
<!DOCTYPE html> <html> <head> <meta charset="ANSI"> <title>ANSI(Windows-1252) character set</title> <link rel="stylesheet" href="style.css"> </head> <body> <div> <p>GeeksforGeeks</p> <p>ANSI(Windows-1252) character set</p> <p>ø , ¼ , þ</p> </div> </body> </html>
Producción:
UTF-8: El estándar Unicode fue desarrollado por el Consorcio Unicode principalmente UTF-8 y UTF-16. El problema con otros conjuntos de caracteres es que son limitados y no son compatibles en un entorno multilingüe. Contiene casi todos los caracteres, puntuación y símbolos. Se recomienda a los desarrolladores que utilicen el conjunto de caracteres UTF-8 de la especificación HTML5.
Sintaxis:
<meta charset="UTF-8">
La siguiente tabla muestra algunos de los códigos de caracteres UTF-8 compatibles con HTML5:
Códigos de caracteres | hexadecimal | Decimal |
Latín extendido-A | 0100-017F | 256-383 |
griego y copto | 0370-03FF | 88-1023 |
flechas | 2190-21FF | 8592-8703 |
Elementos de bloque | 2580-259F | 9600-9631 |
Ejemplo: Este ejemplo muestra cómo usar el juego de caracteres UTF-8 y los caracteres se imprimen usando el juego de caracteres UTF-8.
HTML
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>UTF-8 character set</title> <link rel="stylesheet" href="style.css"> </head> <body> <div> <p>GeeksforGeeks</p> <p>UTF-8 character set</p> <p>Ͷ , ← , Ā </p> </div> </body> </html>
Producción:
Publicación traducida automáticamente
Artículo escrito por siddharthredhu01 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA