Objetivo: El objetivo de este proyecto es desarrollar una herramienta que tome una imagen como entrada y extraiga caracteres (alfabetos, dígitos, símbolos) de ella. La Imagen puede ser un documento manuscrito o un documento Impreso. Se puede utilizar como una forma de entrada de datos de registros impresos.
Herramienta: este proyecto se basa en el aprendizaje automático. Podemos proporcionar una gran cantidad de conjuntos de datos como entrada a la herramienta de software que la máquina reconocerá y extraerá de ellos un patrón similar. Podemos usar Matlab u Octave como herramienta de construcción para este producto, pero se recomienda Octave en estado inicial ya que es gratuito y fácil de usar.
Investigación: Se está investigando mucho sobre este producto y aún se está investigando. Las áreas de investigación incluyen procesamiento de imágenes, procesamiento de lenguaje natural, inteligencia artificial y aprendizaje automático.
Implementación: la implementación de dicha herramienta depende de dos factores: extracción de características y algoritmo de clasificación. Por lo tanto, puede usar varios clasificadores disponibles en línea y también leer sobre el algoritmo básico de extracción de características. La versión básica del producto (de menor precisión) se puede implementar en Octave con un conjunto de datos de entrenamiento limitado y un análisis de componentes simple. Consulte los enlaces a continuación para obtener más información sobre la implementación y la investigación en curso.
http://perun.pmf.uns.ac.rs/radovanovic/dmsem/completed/2006/OCR.pdf
http://crypto.stanford.edu/~dwu4/papers/ICDAR2011.pdf
http://yann.lecun.com/exdb/publis/pdf/matan-90.pdf
También hay una herramienta disponible en línea que reconoce los caracteres de la imagen y los convierte en caracteres codificados por máquina en formato doc o txt: http://www.onlineocr.net/
El campo de tales herramientas es demasiado grande, puede aprender mucho sobre las tecnologías anteriores contribuyendo a proyectos en curso o creando uno propio desde cero.
Esta idea es aportada por Utkarsh Trivedi. Si también desea mostrar su idea de proyecto aquí, envíe un correo electrónico a review-team@geeksforgeeks.org.
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA