¿Cómo clonar una página web usando pywebcopy en Python?

A veces necesitamos una página web útil en su disco duro local. Entonces, aquí vamos a escribir un script Python simple para desechar una página web. El raspado web se utiliza para extraer datos de sitios web para leerlos sin conexión, almacenarlos o cualquier otro motivo. Antes de escribir el script, necesitamos saber pywebcopy. pywebcopy está disponible en PyPi y se instala fácilmente usando pip. Escriba el siguiente comando en la terminal para instalar este módulo

pip install pywebcopy

pywebcopy  Paquete de Python para clonar páginas web y sitios web completos en el almacenamiento local.

Acercarse:

  • Importar pywebcopy
  • Pase el argumento a save_webpage(url=”…”,project_folder=”path/download”,kwargs)
  • Compruebe en su ubicación dada.
     

A continuación se muestra la implementación.

Python3

from pywebcopy import save_webpage
 
kwargs = {'project_name': 'site folder'}
 
save_webpage(
   
    # url pf the website
    url='https://www.geeksforgeeks.org/data-structures/linked-list/',
     
    # folder where the copy will be saved
    project_folder='F:/ro/geek',
    **kwargs
)

Producción:

python clone website

El clon completo de la página web se realiza y almacena en la ubicación especificada. 

Publicación traducida automáticamente

Artículo escrito por kumar_satyam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *