La semana pasada pasé algún tiempo trabajando en la actividad de WikipediaHI para Sugar Desktop Environment. Debo decir que es una de las actividades increíbles con las que me he encontrado. La mejor parte es que puede brindarle datos en modo fuera de línea. Es decir, incluso si no tiene conexión a Internet, que de otro modo se requiere para acceder a Wikipedia en línea, entonces también su actividad en WikipediaHI servirá para su propósito.
Hay muchos desarrolladores y colaboradores que trabajan en forma colaborativa en cosas tan asombrosas que lo inspiran continuamente a tomar cosas nuevas y crear algo que pueda ser utilizado por otros en el mundo. Los desarrolladores y colaboradores de Sugar son el epítome de dicho grupo.
Me encontré con algunos de esos desarrolladores, Anish Mangal y Gonzalo Odiard , dos de ellos cuyas contribuciones son significativas para Sugar. Asumí la tarea de crear WikipediaHI utilizando el volcado de Wikipedia para hindi disponible de forma gratuita. Seguí los pasos especificados en esta página [organizada por Gonzalo] para crear la actividad de Wikipedia en tu propio idioma.
Explicaré rápidamente los pasos que tomé para crear WikipediaHI:
1) Descargado el archivo de volcado de Wikipedia para hindi:
http://dumps.wikimedia.org/hiwiki/20121225/hiwiki-20121225-pages-articles.xml.bz2
NOTA: [Asegúrese de elegir el último archivo válido de aquí: http ://dumps.wikimedia.org/hiwiki/ esta ubicación le mostrará la lista según las fechas. Elija el último volcado y continúe.]
y descargué WikipediaBase desde este enlace
2) Creó el directorio «hola» para HINDI en el directorio WikipediaBase y movió el volcado descargado a esta carpeta.
3) Contenido extraído de este archivo usando:
bzip2 -d hiwiki-20121225-pages-articles.xml.bz2
4) Procesó el volcado utilizando el analizador de páginas:
../tools2/pages_parser.py
El resultado de esta operación generará estos archivos:
hiwiki-20121225-pages-articles.xml.links
hiwiki-20121225-pages-articles.xml.page_templates
hiwiki-20121225-pages-articles.redirects
hiwiki-20121225-pages-articles.templates
5) Luego puede incluir artículos selectivos o todos los artículos de este volcado a su actividad usando este comando:
../tools2/make_selection.py
* Asegúrese de tener favoritos.txt y lista negra.txt llenos con las palabras clave apropiadas.
Ahora, si desea incluir todos los artículos, use este comando:
../tools2/make_selection.py –all
6) Luego proceda a crear el índice para estos artículos:
../tools2/create_index.py
7) Para probar el índice creado en el paso anterior, puede usar este comando:
../tools2/test_index.py
8) El siguiente paso es expandir las plantillas de artículos:
cd ..
./tools2/expandtemplates.py hola
9) Vuelva al directorio hi y vuelva a crear el índice:
cd hi
mv hiwiki-20121225-pages-articles.xml.processed_expanded hiwiki-20121225-pages-articles.xml.processed
../tools2/create_index.py –delete_all
10) Descarga las imágenes de los artículos que seleccionaste:
cd hi
../tools2/download_images.py
si desea descargar las imágenes de las páginas que seleccionó en el paso anterior:
../tools2/download_images.py –all
11) Cree archivos específicos para el idioma:
(a)actividad/actividad.info.lang: archivo de información de actividad para su actividad de idioma
(b)actividad/actividad-wikipedia-lang.svg: icono de actividad para su idioma
(c)actividad_lang.py : archivo de actividad para su idioma
(d)static/about_lang.html : página acerca de wikipedia en su idioma.
(e)static/index_lang.html: página de índice de wikipedia en su idioma. Esta es la página que se muestra cuando se inicia la actividad. Por lo tanto, es importante que conozca los artículos incluidos en search.db (generados cuando se crea el índice) para que pueda crear la página de índice.
12) Cree el archivo XO para wikipedia en su idioma:
./setup_new_wiki.py hi/hiwiki-20121225-pages-articles.xml
Sobre el autor: Kartik es estudiante de posgrado en la Universidad Carnegie Mellon y se especializa en computación móvil, aprendizaje automático y procesamiento de lenguaje natural. Trabajé en LinkedIn antes de ir a CMU. Para saber más sobre mí: http://linkedin.com/in/kartikperisetla
Si también desea exhibir su blog aquí, consulte GBlog para escribir blogs invitados en GeeksforGeeks
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA