Convertir Unicode a ASCII en Python

Unicode es el juego de caracteres universal y un estándar para admitir todos los idiomas del mundo. Contiene más de 140 000 caracteres utilizados por más de 150 scripts junto con varios símbolos. ASCII , por otro lado, es un subconjunto de Unicode y el conjunto de caracteres más compatible, que consta de 128 letras compuestas de letras, dígitos y puntuación en inglés, y el resto son caracteres de control. Este artículo trata sobre la conversión de una amplia gama de caracteres Unicode a una representación ASCII más simple utilizando la biblioteca de Python anyascii .

El texto se convierte de carácter a carácter. Las asignaciones para cada script se basan en esquemas convencionales. Los caracteres simbólicos se convierten en función de su significado o apariencia. Si la entrada contiene caracteres ASCII, no se tocan, el resto se intenta convertir a ASCII. Se eliminan los caracteres desconocidos.

Instalación:

Para instalar este módulo, escriba el siguiente comando en la terminal.

pip install anyascii

Ejemplo 1: Trabajar con varios idiomas

En esto, varios idiomas diferentes, como Unicode, se configuran como entrada, y la salida se proporciona como caracteres ASCII convertidos. 

Python3

from anyascii import anyascii
  
# checking for Hindi script
hindi_uni = anyascii('नमस्ते विद्यार्थी')
  
print("The translation from hindi Script : "
      + str(hindi_uni))
  
# checking for Punjabi script
pun_uni = anyascii('ਸਤਿ ਸ੍ਰੀ ਅਕਾਲ')
  
print("The translation from Punjabi Script : "
      + str(pun_uni))

Producción : 

The translation from hindi Script : nmste vidyarthi
The translation from Punjabi Script : sti sri akal

Ejemplo 2: trabajar con emojis y símbolos Unicode

Esta biblioteca también maneja el trabajo con emojis y símbolos, que generalmente son representaciones Unicode. 

from anyascii import anyascii

# working with emoji example
emoji_uni = anyascii('😎 👑 🍎')

print("The ASCII from emojis : "
      + str(emoji_uni))

# checking for Symbols
sym_uni = anyascii('➕ ☆ ℳ')

print("The ASCII from Symbols : "
      + str(sym_uni))

Producción:

The ASCII from emojis : :sunglasses: :crown: :apple:
The ASCII from Symbols : :heavy_plus_sign: * M

Publicación traducida automáticamente

Artículo escrito por manjeet_04 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *