Requisito previo:
En este artículo, aprenderemos cómo imprimir bonitos en BeautifulSoup usando Python. La biblioteca de requests es una parte integral de Python para realizar requests HTTP a una URL específica. Ya sea que se trate de API REST o Web Scrapping, las requests deben aprenderse para continuar con estas tecnologías. Cuando uno realiza una solicitud a un URI, devuelve una respuesta. Las requests de Python proporcionan funcionalidades integradas para administrar tanto la solicitud como la respuesta.
pip install requests
Beautiful Soup es una biblioteca de Python diseñada para proyectos de respuesta rápida como el raspado de pantalla.
pip install beautifulsoup4
¿Qué es la impresión bonita?
En palabras simples, podemos decir que embellece el HTML con sangrías adecuadas y todo.
Entendamos la implementación paso a paso: –
- Importar módulo requerido
Python3
# Import Required Module import requests from bs4 import BeautifulSoup
- Analizar contenido HTML
Python3
# Web URL Web_url = "Enter WEB URL" # Get URL Content r = requests.get(Web_url) # Parse HTML Code soup = BeautifulSoup(r.content, 'html.parser')
- Bonito el código HTML. BeautifulSoup tiene un método embellecer() .
El método prettify() convertirá un árbol de análisis de Beautiful Soup en una string Unicode bien formateada, con una línea separada para cada etiqueta y cada string:
Python3
print(soup.prettify())
A continuación se muestra la implementación:
Python3
# Import Required Module import requests from bs4 import BeautifulSoup # Web URL Web_url = "https://www.geeksforgeeks.org/transparent-window-in-tkinter/" # Get URL Content r = requests.get(Web_url) # Parse HTML Code soup = BeautifulSoup(r.content, 'html.parser') print(soup.prettify())
Producción: