A veces necesitamos una página web útil en su disco duro local. Entonces, aquí vamos a escribir un script Python simple para desechar una página web. El raspado web se utiliza para extraer datos de sitios web para leerlos sin conexión, almacenarlos o cualquier otro motivo. Antes de escribir el script, necesitamos saber pywebcopy. pywebcopy está disponible en PyPi y se instala fácilmente usando pip. Escriba el siguiente comando en la terminal para instalar este módulo
pip install pywebcopy
pywebcopy Paquete de Python para clonar páginas web y sitios web completos en el almacenamiento local.
Acercarse:
- Importar pywebcopy
- Pase el argumento a save_webpage(url=”…”,project_folder=”path/download”,kwargs)
- Compruebe en su ubicación dada.
A continuación se muestra la implementación.
Python3
from pywebcopy import save_webpage kwargs = {'project_name': 'site folder'} save_webpage( # url pf the website url='https://www.geeksforgeeks.org/data-structures/linked-list/', # folder where the copy will be saved project_folder='F:/ro/geek', **kwargs )
Producción:
El clon completo de la página web se realiza y almacena en la ubicación especificada.
Publicación traducida automáticamente
Artículo escrito por kumar_satyam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA