Unicode generalmente se representa como «\u4EB0\U5317», pero esto es casi inútil para un usuario que realmente quiere leer las cosas reales que dice el texto. Entonces, en este artículo, veremos cómo convertir Unicode a caracteres ASCII usando el módulo Unihandecode.
¿Qué es Unihandecode?
Unihandecode proporciona una función «decodificar (……)» que toma datos Unicode como entrada e intenta representarlos en caracteres ASCII. En un lenguaje simple, podemos decir que es una transliteración para convertir todos los caracteres en Unicode al alfabeto ASCII.
Lista de decodificadores
- ‘ja’: kanji japonés, hiragana y katakana.
- ‘zh’: kanji chino
- ‘kr’: carácter coreano
- ‘vn’: carácter vietnamita
Instalación
Este módulo no viene integrado con Python. Para instalar este tipo, escriba el siguiente comando en la terminal.
pip install unihandecode
Ejemplo:
Python3
from unihandecode import Unihandecoder data1 = Unihandecoder(lang='zh') print(data1.decode("\u660e\u5929\u7684\u98ce\u5439"))
Producción:
Ming Tian De Feng Chui
El argumento de la primera línea toma el nombre del decodificador que desea utilizar. Luego, el decodificador toma una string como argumento y devuelve la string transliterada.