¿Cómo eliminar un elemento secundario en BeautifulSoup?

Beautifulsoup es una biblioteca de Python utilizada para el web scraping. Esta poderosa herramienta de python también se puede usar para modificar páginas web html. Este artículo describe cómo se puede emplear beautifulsoup para eliminar elementos secundarios. Para esto, se utilizan varios métodos del módulo.

Métodos utilizados:

  • clear():
  • descomponer():

Acercarse:

  • Módulo de importación.
  • Eliminar datos de la página web.
  • Analice la string raspada a html.
  • Busque la etiqueta cuyo elemento secundario se eliminará.
  • Utilice cualquiera de los métodos: clear(), decompose() o replace().
  • Imprimir contenido reemplazado.

Ejemplo 1:

Python3

# importing module
from bs4 import BeautifulSoup
  
markup = """
  
<!DOCTYPE>
<html>
  <head><title>Example</title></head>
  <body>
  <div id="parent">
    
<p>
    This is child of div with id = "parent".
    <span>Child of "P"</span>
  </p>
  
  <div>
  Another Child of div with id = "parent".
  </div>
  </div>
  
    
<p>
  Piyush
  </p>
  
                     
  </body>
</html>
"""
  
# parsering string to HTML
soup = BeautifulSoup(markup, 'html.parser')
  
# finding tag whose child to be deleted
div_bs4 = soup.find('div')
  
# delete the child element
div_bs4.clear()
  
print(div_bs4)

Producción:

<div id="parent"></div>

Ejemplo 2:

Python3

# importing module
from bs4 import BeautifulSoup
  
markup = """
  
<!DOCTYPE>
<html>
  <head><title>Example</title></head>
  <body>
  <div id="parent">
    
<p>
    This is child of div with id = "parent".
    <span>Child of "P"</span>
  </p>
  
  <div>
  Another Child of div with id = "parent".
  </div>
  </div>
  
    
<p>
  Piyush
  </p>
  
                     
  </body>
</html>
"""
  
# parsering string to HTML
soup = BeautifulSoup(markup, 'html.parser')
  
# finding tag whose child to be deleted
div_bs4 = soup.find('div')
  
# delete the child element
div_bs4.decompose()
  
print(div_bs4)

Producción:

<None></None>

Ejemplo 3:

Python3

# importing module
from bs4 import BeautifulSoup
  
markup = """
  
<!DOCTYPE>
<html>
  <head><title>Example</title></head>
  <body>
  <div id="parent">
    
<p>
    This is child of div with id = "parent".
    <span>Child of "P"</span>
  </p>
  
  <div>
  Another Child of div with id = "parent".
  </div>
  </div>
  
    
<p>
  Piyush
  </p>
  
                     
  </body>
</html>
"""
  
# parsering string to HTML
soup = BeautifulSoup(markup, 'html.parser')
  
# finding tag whose child to be deleted
div_bs4 = soup.find('div')
  
# delete the child element
div_bs4.replaceWith('')
  
print(div_bs4)

Producción:

<div id="parent">
<p>
    This is child of div with id = "parent".
    <span>Child of "P"</span>
</p>
<div>
  Another Child of div with id = "parent".
  </div>
</div>

Publicación traducida automáticamente

Artículo escrito por maheswaripiyush9 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *