Mostrar texto dentro de las etiquetas usando BeautifulSoup

Requisito previo:

En este artículo, aprenderemos cómo obtener un texto de las etiquetas HTML usando BeautifulSoup. Aquí usaremos las requests y el módulo BeautifulSoup en Python.

La biblioteca de requests es una parte integral de Python para realizar requests HTTP a una URL específica. Ya sea que se trate de API REST o Web Scrapping, las requests deben aprenderse para continuar con estas tecnologías. Cuando uno realiza una solicitud a un URI, devuelve una respuesta. Las requests de Python proporcionan funcionalidades integradas para administrar tanto la solicitud como la respuesta.

pip install requests

Beautiful Soup es una biblioteca de Python diseñada para proyectos de respuesta rápida como el raspado de pantalla.

pip install beautifulsoup4

Método 1: podemos usar la propiedad de texto . Solo imprimirá el texto de la etiqueta.

Python3

# Import Required Module
import requests 
from bs4 import BeautifulSoup
  
# Web URL
Web_url = "https://www.geeksforgeeks.org/"
  
# Get URL Content
r = requests.get(Web_url) 
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')
  
tag = soup.find("p")
  
print(tag.text)

Producción:

Skip to content

Método 2: También podemos usar el método get_text() . Este método se utiliza para imprimir todo el texto de la página web.

Python3

# Import Required Module
import requests 
from bs4 import BeautifulSoup
  
# Web URL
Web_url = "https://www.geeksforgeeks.org/"
  
# Get URL Content
r = requests.get(Web_url) 
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')
  
tag = soup.find("p")
  
print(tag.get_text())

Producción:

February 1, 2021

Método 3: si solo hay una string dentro de la etiqueta, podemos usar la propiedad de string .

Python3

# Import Required Module
import requests 
from bs4 import BeautifulSoup
  
# Web URL
Web_url = "https://www.geeksforgeeks.org/"
  
# Get URL Content
r = requests.get(Web_url) 
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')
  
tag = soup.find("p")
  
print(tag.string)

Producción:

February 1, 2021

Publicación traducida automáticamente

Artículo escrito por abhigoya y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *