A veces, al extraer datos de una página web HTML, ¿quiere saber cuántas etiquetas de párrafo se utilizan en un documento HTML determinado? No se preocupe, hablaremos de esto en este artículo.
Sintaxis:
print(len(soup.find_all("p")))
Acercarse:
Paso 1: Primero, importe las bibliotecas, BeautifulSoup y os.
from bs4 import BeautifulSoup as bs import os
Paso 2: ahora, elimine el último segmento de la ruta ingresando el nombre del archivo de Python en el que está trabajando actualmente.
base=os.path.dirname(os.path.abspath(‘#Nombre del archivo de Python en el que está trabajando actualmente’))
Paso 3: luego, abra el archivo HTML desde el que desea leer el valor.
html=open(os.path.join(base, ‘#Nombre del archivo HTML del que desea leer el valor’))
Paso 4: Además, analice el archivo HTML en BeautifulSoup.
soup=bs(html, 'html.parser')
Paso 5: A continuación, imprima una determinada línea si lo desea.
print("Number of paragraph tags:")
Paso 6: Finalmente, calcule e imprima el número de etiquetas de párrafo en el documento HTML.
print(len(soup.find_all("p")))
Implementación:
Ejemplo 1
Consideremos la página web HTML simple, que tiene numerosas etiquetas de párrafo.
HTML
<!DOCTYPE html> <html> <head> Geeks For Geeks </head> <body> <div> <p>King</p> <p>Prince</p> <p>Queen</p> </div> <p id="vinayak">Princess</p> </body> </html>
Para encontrar la cantidad de etiquetas de párrafo en la página web HTML anterior, implemente el siguiente código.
Python
# Python program to get number of paragraph tags # of a given HTML document in Beautifulsoup # Import the libraries beautifulsoup # and os from bs4 import BeautifulSoup as bs import os # Open the HTML file html = open('gfg.html') # Parse HTML file in Beautiful Soup soup = bs(html, 'html.parser') # Print a certain line print("Number of paragraph tags:") # Calculating and printing the # number of paragraph tags print(len(soup.find_all("p")))
Producción:
Ejemplo 2
En el siguiente programa, encontraremos el número de etiquetas de párrafo en un sitio web en particular.
Python
# Python program to get number of paragraph tags # of a given Website in Beautifulsoup # Import the libraries beautifulsoup # and os from bs4 import BeautifulSoup as bs import os import requests # Assign URL URL = 'https://www.geeksforgeeks.org/' # Page content from Website URL page = requests.get(URL) # Parse HTML file in Beautiful Soup soup = bs(page.content, 'html.parser') # Print a certain line print("Number of paragraph tags:") # Calculating and printing the # number of paragraph tags print(len(soup.find_all("p")))
Producción: