Unicode es el juego de caracteres universal y un estándar para admitir todos los idiomas del mundo. Contiene más de 140 000 caracteres utilizados por más de 150 scripts junto con varios símbolos. ASCII , por otro lado, es un subconjunto de Unicode y el conjunto de caracteres más compatible, que consta de 128 letras compuestas de letras, dígitos y puntuación en inglés, y el resto son caracteres de control. Este artículo trata sobre la conversión de una amplia gama de caracteres Unicode a una representación ASCII más simple utilizando la biblioteca de Python anyascii .
El texto se convierte de carácter a carácter. Las asignaciones para cada script se basan en esquemas convencionales. Los caracteres simbólicos se convierten en función de su significado o apariencia. Si la entrada contiene caracteres ASCII, no se tocan, el resto se intenta convertir a ASCII. Se eliminan los caracteres desconocidos.
Instalación:
Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install anyascii
Ejemplo 1: Trabajar con varios idiomas
En esto, varios idiomas diferentes, como Unicode, se configuran como entrada, y la salida se proporciona como caracteres ASCII convertidos.
Python3
from anyascii import anyascii # checking for Hindi script hindi_uni = anyascii('नमस्ते विद्यार्थी') print("The translation from hindi Script : " + str(hindi_uni)) # checking for Punjabi script pun_uni = anyascii('ਸਤਿ ਸ੍ਰੀ ਅਕਾਲ') print("The translation from Punjabi Script : " + str(pun_uni))
Producción :
The translation from hindi Script : nmste vidyarthi The translation from Punjabi Script : sti sri akal
Ejemplo 2: trabajar con emojis y símbolos Unicode
Esta biblioteca también maneja el trabajo con emojis y símbolos, que generalmente son representaciones Unicode.
from anyascii import anyascii # working with emoji example emoji_uni = anyascii('😎 👑 🍎') print("The ASCII from emojis : " + str(emoji_uni)) # checking for Symbols sym_uni = anyascii('➕ ☆ ℳ') print("The ASCII from Symbols : " + str(sym_uni))
Producción:
The ASCII from emojis : :sunglasses: :crown: :apple: The ASCII from Symbols : :heavy_plus_sign: * M
Publicación traducida automáticamente
Artículo escrito por manjeet_04 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA