El raspado es el proceso de recopilación de metadatos web o información web a través de rastreadores web. Podemos obtener los enlaces asociados con el dominio, también podemos recuperar los enlaces del archivo JavaScript y muchos más. Para realizar web scraping usamos la biblioteca Scrapy. Está escrito puramente en Python. En este artículo, analizaremos el proceso de instalación del módulo Scrapy en el sistema operativo Linux.
Requisitos:
Instalación del paquete Python-Scrapy en Linux usando PIP
Para instalar el paquete Python-Scrapy en Linux tenemos que seguir los siguientes pasos:
Paso 1: En primer lugar, instalaremos Python3 en nuestra máquina Linux. Use el siguiente comando en la terminal para instalar la última versión de Python3.
sudo apt-get install python3
Paso 2: ahora, instale el módulo pip que se requiere para instalar y administrar los paquetes en Python3. Entonces use el siguiente comando para la instalación:
sudo apt install python3-pip
Paso 3: Ahora, instala el paquete Python-Scrapy con la ayuda del siguiente comando:
sudo pip3 instalar scrapy
o
sudo apt-get install python3-scrapy
Verificación de la instalación del paquete Python-Scrapy en Linux usando PIP
Para verificar si el paquete Python-Scrapy se instaló correctamente en su sistema, ejecute el siguiente comando en la Terminal:
python3 -m pip muestra scrapy
Recibirá el siguiente mensaje si el proceso de instalación se completa con éxito:
Publicación traducida automáticamente
Artículo escrito por gauravgandal y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA