Prerrequisitos: Beautifulsoup
En este artículo, discutiremos cómo se puede emplear beautifulsoup para encontrar una etiqueta con el valor de atributo dado en un documento HTML.
Acercarse:
- Módulo de importación.
- Extraer datos de una página web.
- Analizar la string raspada a HTML.
- Use la función find() para encontrar el atributo y la etiqueta.
- Imprime el resultado.
Sintaxis: find(attr_name=”valor”)
A continuación se muestran algunas implementaciones del enfoque anterior:
Ejemplo 1:
Python3
# importing module from bs4 import BeautifulSoup markup = '''<html><body><div id="container">Div Content</div></body></html>''' soup = BeautifulSoup(markup, 'html.parser') # finding the tag with the id attribute div_bs4 = soup.find(id = "container") print(div_bs4.name)
Producción:
div
Ejemplo 2:
Python3
# importing module from bs4 import BeautifulSoup markup = '''<html><body><a href="https://www.geeksforgeeks.org/">Geeks for Geeks</a></body></html>''' soup = BeautifulSoup(markup, 'html.parser') # finding the tag with the href attribute div_bs4 = soup.find(href = "https://www.geeksforgeeks.org/") print(div_bs4.name)
Producción:
a
Ejemplo 3:
Python3
# importing module from bs4 import BeautifulSoup markup = """<html><head><title>Welcome to geeksforgeeks</title></head> <body> <p class="title"><b>Geeks</b></p> <p class="gfg">geeksforgeeks a computer science portal for geeks </body> """ soup = BeautifulSoup(markup, 'html.parser') # finding the tag with the class attribute div_bs4 = soup.find(class_ = "gfg") print(div_bs4.name)
Producción:
p
Publicación traducida automáticamente
Artículo escrito por maheswaripiyush9 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA