¿Cómo raspar los datos web usando Cheerio en Node.js?

Node.js es un entorno de código abierto y multiplataforma que se crea con el motor Chrome JavaScript. Node.js se usa para ejecutar el código javascript desde fuera del navegador.

Cheerio: Su funcionamiento está basado en jQuery. Está trabajando totalmente en el modelo DOM consistente. Cheerio se usa para raspar datos web a veces y también para tareas automatizadas.

Enfoque: en este artículo, eliminamos los datos de World Meter, un sitio web de información de covid donde obtenemos el total de casos confirmados, el número total de muertes y el total de pacientes que se recuperaron hasta ahora.

A continuación se muestra la implementación paso a paso:

Paso 1: ingrese el cmd y escriba el siguiente comando que creará el archivo package.json

npm init

Paso 2: Después de crear el paquete, el archivo JSON necesita instalar Cheerio, Request y Chalk desde el siguiente comando:

npm install request cheerio chalk

Paso 3: ahora el directorio de su proyecto se ve así:

Estructura del proyecto

Paso 4: Ahora creamos el archivo index.js y escribimos el siguiente código:

index.js

const { Cheerio } = require("cheerio");
const request = require("request");
const cheerio = require("cheerio");
const chalk = require("chalk");
  
request("https://www.worldometers.info/coronavirus/", cb);
  
function cb(error, response, html) {
  if (error) {
    console.error("Error:", error);
  } else {
    handleItem(html);
  }
}
function handleItem(html) {
  let setTool = cheerio.load(html);
  let contentArr = setTool("#maincounter-wrap span");
  
  let total = setTool(contentArr[0]).text();
  let death = setTool(contentArr[1]).text();
  let recovered = setTool(contentArr[2]).text();
  
  console.log(chalk.gray("Total cases:" + total));
  console.log(chalk.red("Total Death:" + death));
  console.log(chalk.green("Total cases:" + recovered));
}

Salida: abra el símbolo del sistema e ingrese el siguiente comando

node index.js

Producción

Publicación traducida automáticamente

Artículo escrito por nishantsinghgfg y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *