Cambie Unicode a caracteres ASCII usando Unihandecode

Unicode generalmente se representa como «\u4EB0\U5317», pero esto es casi inútil para un usuario que realmente quiere leer las cosas reales que dice el texto. Entonces, en este artículo, veremos cómo convertir Unicode a caracteres ASCII usando el módulo Unihandecode.

¿Qué es Unihandecode?

Unihandecode proporciona una función «decodificar (……)» que toma datos Unicode como entrada e intenta representarlos en caracteres ASCII. En un lenguaje simple, podemos decir que es una transliteración para convertir todos los caracteres en Unicode al alfabeto ASCII.

Lista de decodificadores

  •  ‘ja’: kanji japonés, hiragana y katakana.
  •  ‘zh’: kanji chino 
  •  ‘kr’: carácter coreano
  •  ‘vn’: carácter vietnamita

Instalación

Este módulo no viene integrado con Python. Para instalar este tipo, escriba el siguiente comando en la terminal.

pip install unihandecode 

Ejemplo:

Python3

from unihandecode import Unihandecoder
  
data1 = Unihandecoder(lang='zh')
print(data1.decode("\u660e\u5929\u7684\u98ce\u5439"))

Producción: 

Ming Tian De Feng Chui

El argumento de la primera línea toma el nombre del decodificador que desea utilizar. Luego, el decodificador toma una string como argumento y devuelve la string transliterada.

Publicación traducida automáticamente

Artículo escrito por skrg141 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *