Como sabemos, el mundo enfrenta un desafío sin precedentes con comunidades y economías en todas partes afectadas por el COVID19. Entonces, vamos a divertirnos durante este tiempo rastreando su vacuna. Veamos un script de Python simple para mejorar el seguimiento de la vacuna COVID19.
Módulos necesarios
- bs4 : Beautiful Soup (bs4) es una biblioteca de Python para extraer datos de archivos HTML y XML. Este módulo no viene integrado con Python. Para instalar este tipo, escriba el siguiente comando en la terminal.
pip install bs4
- requests : Requests le permite enviar requests HTTP/1.1 muy fácilmente. Este módulo tampoco viene integrado con Python. Para instalar este tipo, escriba el siguiente comando en la terminal.
pip install requests
Acercarse:
- Extraer formulario de datos URL dada
- Raspe los datos con la ayuda de requests y Beautiful Soup
- Convierta esos datos en código html.
- Encuentre los detalles requeridos y fíltrelos.
Veamos la ejecución paso a paso del script.
Paso 1: importar todas las dependencias
Python3
import requests from bs4 import BeautifulSoup
Paso 2: Cree una función de obtención de URL
Python3
def getdata(url): r = requests.get(url) return r.text
Paso 3: ahora pase la URL a la función getdata y convierta esos datos en código HTML
Python3
htmldata = getdata("https://covid-19tracker.milkeninstitute.org/") soup = BeautifulSoup(htmldata, 'html.parser') res = soup.find_all("div", class_="is_h5-2 is_developer w-richtext") print(str(res))
Producción:
Nota: estos scripts le darán solo datos sin procesar en formato de string que tiene que imprimir sus datos con sus necesidades.
Código completo:
Python3
import requests from bs4 import BeautifulSoup def getdata(url): r = requests.get(url) return r.text htmldata = getdata("https://covid-19tracker.milkeninstitute.org/") soup = BeautifulSoup(htmldata, 'html.parser') result = str(soup.find_all("div", class_="is_h5-2 is_developer w-richtext")) print("NO 1 " + result[46:86]) print("NO 2 "+result[139:226]) print("NO 3 "+result[279:305]) print("NO 4 "+result[358:375]) print("NO 5 "+result[428:509])
Producción:
Publicación traducida automáticamente
Artículo escrito por kumar_satyam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA