Beautifulsoup es una biblioteca de Python utilizada para el web scraping. Esta poderosa herramienta de python también se puede usar para modificar páginas web html. Este artículo describe cómo se puede emplear beautifulsoup para eliminar elementos secundarios. Para esto, se utilizan varios métodos del módulo.
Métodos utilizados:
- clear():
- descomponer():
Acercarse:
- Módulo de importación.
- Eliminar datos de la página web.
- Analice la string raspada a html.
- Busque la etiqueta cuyo elemento secundario se eliminará.
- Utilice cualquiera de los métodos: clear(), decompose() o replace().
- Imprimir contenido reemplazado.
Ejemplo 1:
Python3
# importing module from bs4 import BeautifulSoup markup = """ <!DOCTYPE> <html> <head><title>Example</title></head> <body> <div id="parent"> <p> This is child of div with id = "parent". <span>Child of "P"</span> </p> <div> Another Child of div with id = "parent". </div> </div> <p> Piyush </p> </body> </html> """ # parsering string to HTML soup = BeautifulSoup(markup, 'html.parser') # finding tag whose child to be deleted div_bs4 = soup.find('div') # delete the child element div_bs4.clear() print(div_bs4)
Producción:
<div id="parent"></div>
Ejemplo 2:
Python3
# importing module from bs4 import BeautifulSoup markup = """ <!DOCTYPE> <html> <head><title>Example</title></head> <body> <div id="parent"> <p> This is child of div with id = "parent". <span>Child of "P"</span> </p> <div> Another Child of div with id = "parent". </div> </div> <p> Piyush </p> </body> </html> """ # parsering string to HTML soup = BeautifulSoup(markup, 'html.parser') # finding tag whose child to be deleted div_bs4 = soup.find('div') # delete the child element div_bs4.decompose() print(div_bs4)
Producción:
<None></None>
Ejemplo 3:
Python3
# importing module from bs4 import BeautifulSoup markup = """ <!DOCTYPE> <html> <head><title>Example</title></head> <body> <div id="parent"> <p> This is child of div with id = "parent". <span>Child of "P"</span> </p> <div> Another Child of div with id = "parent". </div> </div> <p> Piyush </p> </body> </html> """ # parsering string to HTML soup = BeautifulSoup(markup, 'html.parser') # finding tag whose child to be deleted div_bs4 = soup.find('div') # delete the child element div_bs4.replaceWith('') print(div_bs4)
Producción:
<div id="parent"> <p> This is child of div with id = "parent". <span>Child of "P"</span> </p> <div> Another Child of div with id = "parent". </div> </div>
Publicación traducida automáticamente
Artículo escrito por maheswaripiyush9 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA