¿Cómo raspar un comentario usando Beautifulsoup en Python?

Los comentarios son proporcionados por Beautiful Soup, que es un marco de web scraping para Python. El raspado web es el proceso de extracción de datos del sitio web utilizando herramientas automatizadas para acelerar el proceso. El objeto Comment es solo un tipo especial de NavigableString y se usa para hacer que el código base sea más legible.

Sintaxis: 

<!-- COMMENT --> 

Los siguientes ejemplos explican el concepto de comentarios en Beautiful Soup.  
Ejemplo 1: En este ejemplo, vamos a crear un comentario.

Python3

# Import Beautiful Soup
from bs4 import BeautifulSoup
  
# Create the document
doc = "<b><!-- COMMENT --></b>"
  
# Initialize the object with the document
soup = BeautifulSoup(doc, "html.parser")
  
# Get the whole comment inside b tag
comment = soup.b
  
# Print the comment
print(comment)

Producción: 

<b><!-- COMMENT --></b>

Ejemplo 2: En este ejemplo, vamos a crear un comentario y ver su tipo.

Python3

# Import Beautiful Soup
from bs4 import BeautifulSoup
  
# Create the document
doc = "<b><!-- COMMENT --></b>"
  
# Initialize the object with the document
soup = BeautifulSoup(doc, "html.parser")
  
# Get the whole comment inside b tag
comment = soup.b.string
  
# Print the type of the comment
print(type(comment))

Producción: 

<class 'bs4.element.Comment'> 

Publicación traducida automáticamente

Artículo escrito por gurrrung y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *