Inserte etiquetas o strings inmediatamente antes y después de las etiquetas especificadas usando BeautifulSoup

BeautifulSoup es una biblioteca de Python que se utiliza para extraer datos de lenguajes de marcado como HTML, XML, etc. Por ejemplo, digamos que tenemos algunas páginas web que necesitaban mostrar datos relevantes relacionados con alguna investigación, como procesar información como la fecha o la dirección, pero que no tienen forma de descargarla, en tales casos, BeautifulSoup nos resulta útil ya que ayuda. nosotros en la extracción de contenido particular de la página HTML y guarda la información. BeautifulSoup es una herramienta eficaz para el web scraping que ayuda a limpiar y analizar documentos extraídos de la web.

Instalación de bibliotecas requeridas:

  • bs4: como BeautifulSoup no se proporciona de forma predeterminada en python, debemos instalarlo en nuestras máquinas usando el siguiente comando con pip.
pip install bs4
  • lxml: lxml es una unión madura de las bibliotecas libxml2 y libxlst de Python, con la ayuda de la API de ElementTree, proporciona un acceso seguro y conveniente a esas bibliotecas.
pip install lxml

Funciones utilizadas: 

  • tag(): implementación de Python para insertar etiquetas o strings antes de las etiquetas especificadas con BeautifulSoup.
  • insert(): la función insert() en BeautifulSoup se usa para insertar elementos en el objeto de etiqueta, es similar a .inert() en una lista de python.
  • insert_before(): El método insert_before() inserta etiquetas o strings inmediatamente antes de otra cosa en el árbol de análisis.
  • insert_after(): El método insert_after inserta etiquetas o strings siguiendo algo más en el árbol de análisis dado.

Enfoque paso a paso:

  • En primer lugar, importamos la biblioteca BeautifulSoup usando bs4.
  • Asignamos un atributo a BeautifulSoup y lo llenamos con la URL de origen para la que estamos tratando de implementar nuestro programa.
  • Asignamos un nuevo elemento en el objeto de etiqueta usando new_tag().
  • Asignamos una string al objeto de etiqueta para adjuntar nuestras etiquetas antes o después (según lo especificado).
  • Insertamos la etiqueta antes de la string usando la función insert_before().

Implementación:

Ejemplo 1: Implementación de Python para insertar etiquetas o strings antes de las etiquetas especificadas con BeautifulSoup.

Python3

# import module
from bs4 import BeautifulSoup
 
# assign URL
s = BeautifulSoup("<b>www.geeksforgeeks.com</b>",
                  "lxml")
 
print("Original Markup:")
print(s.b)
 
# insert tag
tag = s.new_tag("k")
tag.string = "Python"
 
print("\nNew Markup, before inserting the text:")
s.b.string.insert_before(tag)
print(s.b)

Producción:

Ejemplo 2: aquí hay otra implementación para insertar etiquetas o strings después de las etiquetas especificadas.

Python3

# import module
from bs4 import BeautifulSoup
 
# assign URL
s = BeautifulSoup("<b>www.geeksforgeeks.com</b>",
                  "lxml")
 
print("Original Markup:")
print(s.b)
 
# insert tag
tag = s.new_tag("k")
tag.string = "Python"
 
print("\nNew Markup, before inserting the text:")
s.b.string.insert_after(tag)
print(s.b)

Producción:

Publicación traducida automáticamente

Artículo escrito por ravi.geek24 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *