Cuente el número total de enlaces en la página web usando Selenium en Python

Selenium es una poderosa herramienta para controlar los navegadores web a través de programas y realizar la automatización del navegador. Es funcional para todos los navegadores, funciona en todos los principales sistemas operativos y sus scripts están escritos en varios lenguajes, es decir, Python, Java, C#, etc. Trabajaremos con Python.

Instalación

1.1 Enlaces de Selenium en Python
Los enlaces de Selenium Python proporcionan una API conveniente para acceder a Selenium Web Driver como Firefox, Chrome, etc.

Pip install Selenium 

1.2 Controladores web
Selenium requiere un controlador web para interactuar con el navegador elegido. Web drivers es un paquete para interactuar con un navegador web. Interactúa con el navegador web o un servidor web remoto a través de un protocolo de conexión común a todos. Puede comprobar e instalar los controladores web de su elección de navegador.

Chrome:    https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox: https://github.com/mozilla/geckodriver/releases
Safari:    https://webkit.org/blog/6900/webdriver-support-in-safari-10/

Enfoque paso a paso:

  • Importar módulos requeridos

Python3

# import modules 
from selenium import webdriver 
from selenium.webdriver.common.by import By 
import time
  • Tomando cualquier URL .

Python3

# assign web page url 
driver.get("https://www.geeksforgeeks.org/")
  • utilizando By.TAG_NAME , busque el enlace web en la página web.

Implementación:

Python3

#import module
from selenium import webdriver
from selenium.webdriver.common.by import By
  
  
driver = webdriver.Chrome()
  
# url
driver.get('https://www.geeksforgeeks.org/')
  
# find web links
link = driver.find_elements(By.TAG_NAME, 'a')
  
# using len function count how many links
print(len(link))

Producción:

Publicación traducida automáticamente

Artículo escrito por iamjpsonkar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *