Cuente el número de etiquetas de párrafo usando BeautifulSoup

A veces, al extraer datos de una página web HTML, ¿quiere saber cuántas etiquetas de párrafo se utilizan en un documento HTML determinado? No se preocupe, hablaremos de esto en este artículo.

Sintaxis:

print(len(soup.find_all("p")))

Acercarse:

Paso 1: Primero, importe las bibliotecas, BeautifulSoup y os.

from bs4 import BeautifulSoup as bs
import os

Paso 2: ahora, elimine el último segmento de la ruta ingresando el nombre del archivo de Python en el que está trabajando actualmente.

base=os.path.dirname(os.path.abspath(‘#Nombre del archivo de Python en el que está trabajando actualmente’))

Paso 3: luego, abra el archivo HTML desde el que desea leer el valor.

html=open(os.path.join(base, ‘#Nombre del archivo HTML del que desea leer el valor’))

Paso 4: Además, analice el archivo HTML en BeautifulSoup.

soup=bs(html, 'html.parser')

Paso 5: A continuación, imprima una determinada línea si lo desea. 

print("Number of paragraph tags:")

Paso 6: Finalmente, calcule e imprima el número de etiquetas de párrafo en el documento HTML.

print(len(soup.find_all("p")))

Implementación: 

Ejemplo 1

Consideremos la página web HTML simple, que tiene numerosas etiquetas de párrafo.

HTML

<!DOCTYPE html>
<html>
    
 <head>
   Geeks For Geeks
 </head>
    
 <body>
     
 <div>
       
<p>King</p>
  
       
<p>Prince</p>
  
       
<p>Queen</p>
  
 </div>
     
 <p id="vinayak">Princess</p>
  
  </body>
    
</html>

Para encontrar la cantidad de etiquetas de párrafo en la página web HTML anterior, implemente el siguiente código.

Python

# Python program to get number of paragraph tags
# of a given HTML document in Beautifulsoup
  
# Import the libraries beautifulsoup 
# and os
from bs4 import BeautifulSoup as bs
import os
  
# Open the HTML file
html = open('gfg.html')
  
# Parse HTML file in Beautiful Soup
soup = bs(html, 'html.parser')
  
# Print a certain line
print("Number of paragraph tags:")
  
# Calculating and printing the
# number of paragraph tags
print(len(soup.find_all("p")))

Producción:

Ejemplo 2

En el siguiente programa, encontraremos el número de etiquetas de párrafo en un sitio web en particular.

Python

# Python program to get number of paragraph tags
# of a given Website in Beautifulsoup
  
# Import the libraries beautifulsoup 
# and os
from bs4 import BeautifulSoup as bs
import os
import requests
  
# Assign URL
URL = 'https://www.geeksforgeeks.org/'
  
# Page content from Website URL
page = requests.get(URL)
  
# Parse HTML file in Beautiful Soup
soup = bs(page.content, 'html.parser')
  
# Print a certain line
print("Number of paragraph tags:")
  
# Calculating and printing the
# number of paragraph tags
print(len(soup.find_all("p")))

Producción:

Publicación traducida automáticamente

Artículo escrito por vin8rai y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *