¿Qué es la codificación de caracteres de almacenamiento interno (ISCII)?

Todos sabemos que la computadora no almacena directamente letras, números e imágenes directamente. Los convierte en pequeñas piezas llamadas bits, que tienen dos valores, 0 o 1. Para representar cada letra o número correctamente, necesitamos algunas reglas para almacenarlos correctamente. Estas reglas corresponden al esquema de codificación. Veremos los 3 esquemas de codificación de almacenamiento más populares: 

ASCII

ASCII significa Código Estándar Estadounidense para el Intercambio de Información . ASCII fue introducido en el año 1963 por la American Standards Association (ASA). ASCII se clasifica ampliamente en 2 subcategorías:  

  • ASCII estándar: ASCII estándar representa la primera mitad de ASCII, es decir, los primeros 128 caracteres del 0 al 127. El ASCII estándar comprende el ASCII inferior y el no imprimible. El ASCII no imprimible contiene los caracteres que no se pueden imprimir en la pantalla y comprende varios códigos de sistema. Comienzan en el rango 0 a 31. El ASCII inferior comprende el rango restante del ASCII estándar, es decir, del 32 al 127. Contiene letras, números y símbolos especiales.
  • ASCII extendido: se propuso ASCII extendido porque, aunque el ASCII estándar era suficiente para representar todos los caracteres principales de los idiomas principales, no era suficiente para cubrirlos a todos. Extended ASCII soluciona esto agregando más 128 caracteres, lo que eleva el total de caracteres ASCII a 256.

ISCII

ISCII significa Código de escritura india para el intercambio de información . Fue propuesto por el Bureau of Indian Standards (BIS) en el año 1991. Es un estándar de 8 bits donde los primeros 128 caracteres, es decir, del 0 al 127 son los mismos que el estándar ASCII. Los siguientes 128 caracteres constituyen los caracteres de las escrituras indias. Los idiomas más populares que se hablan en la India están presentes en la codificación. Estos incluyen devanagari, gujarati, bengalí, oriya, punjabi, asamés, kannada, telugu, malayalam, tamil.  

Unicode

Con la invención de ASCII, se pensó que la codificación de caracteres era limitada y no era suficiente para cubrir todos los idiomas del mundo. Por lo tanto, se necesitaba un nuevo esquema de codificación para cubrir todos los idiomas. El Consorcio Unicode , una organización sin fines de lucro, diseñó y desarrolló Unicode en el año 1991. Inicialmente, solo había 50 000 caracteres presentes. Pero hoy, Unicode cubre más de 128 000 caracteres. 

Tipos de codificación Unicode: 

  • UTF-8: Utiliza 8 bits para su codificación. Se utiliza en el correo electrónico a través de Internet. Es un esquema de codificación estándar utilizado en programas web y de software.
  • UTF-16: utiliza 2 bytes, es decir, 16 bits para la codificación.
  • UTF-32: utiliza 4 bytes, es decir, 32 bits para la codificación.

¿Por qué necesitamos Unicode? 

  • Unicode nos permite diseñar una sola aplicación para muchas plataformas e idiomas. No necesitamos rehacer la misma aplicación para ejecutarla en otro idioma.
  • Esto conduce a la reducción de los costos de desarrollo de aplicaciones.
  • Previene la corrupción de datos.
  • Actúa como un esquema de codificación único en todos los idiomas y plataformas.
  • Puede considerarse un superconjunto de todos los esquemas de codificación y, por lo tanto, podemos convertir todos los esquemas de codificación a Unicode y viceversa.

Publicación traducida automáticamente

Artículo escrito por chinmay_bhide y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *