¿Cómo eliminar etiquetas usando BeautifulSoup en Python?

Requisito previo: módulo Beautifulsoup En este artículo, vamos a redactar un script de python que elimina una etiqueta del árbol y luego la destruye por completo junto con su contenido. Para esto, se utiliza el método decompose() que viene integrado en el módulo. Sintaxis: Beautifulsoup.Tag.decompose() Tag.decompose() elimina una etiqueta del árbol de un documento HTML … Continue reading «¿Cómo eliminar etiquetas usando BeautifulSoup en Python?»

Web Scraping sin ser bloqueado

Web Scraping se refiere al proceso de raspado/extracción de datos de un sitio web utilizando el protocolo HTTP o el navegador web. El proceso puede ser manual o puede automatizarse usando un bot o un rastreador web. Además, existe la idea errónea de que el web scraping es ilegal, la verdad es que es perfectamente … Continue reading «Web Scraping sin ser bloqueado»

Cita el juego de adivinanzas usando Web Scraping en Python

Requisito previo: instalación de BeautifulSoup  En este artículo, extraeremos una cita y los detalles del autor de este sitio http//quotes.toscrape.com usando el marco de Python llamado BeautifulSoup y desarrollaremos un juego de adivinanzas usando diferentes estructuras de datos y algoritmos. El usuario tendrá 4 oportunidades para adivinar el autor de una cita famosa. En cada … Continue reading «Cita el juego de adivinanzas usando Web Scraping en Python»

Python: obtenga casos confirmados, recuperados y de muertes de Corona en todo el mundo

En este artículo, veremos cómo podemos crear un script de Python que informe sobre los casos de corona en todo el mundo, es decir, la cantidad de casos confirmados, la cantidad de casos en los que el paciente se recuperó y el total de muertes debido a corona. Módulos requeridos e Instalación: Requests: Requests le … Continue reading «Python: obtenga casos confirmados, recuperados y de muertes de Corona en todo el mundo»

Python: calcule la frecuencia de las palabras después de eliminar las palabras vacías y la lematización

En este artículo, vamos a tokenizar el contenido de la oración, el párrafo y la página web utilizando el kit de herramientas NLTK en el entorno de Python, luego eliminaremos las palabras vacías y aplicaremos la lematización en el contenido de la oración, el párrafo y la página web. Finalmente, calcularemos la frecuencia de las … Continue reading «Python: calcule la frecuencia de las palabras después de eliminar las palabras vacías y la lematización»