Cómo descargar conjuntos de datos de Kaggle en Jupyter Notebook

En este artículo, veremos cómo descargar conjuntos de datos de Kaggle usando Jupyter Notebook.

Empezando

Aquí, cubriremos dos métodos diferentes para comenzar a trabajar con Jupyter Notebook. En el primer método, usaremos la API de Kaggle para descargar nuestro conjunto de datos y, después de eso, estamos listos para usar nuestro conjunto de datos. En otro método, descargamos manualmente desde el sitio web de Kaggle y usamos nuestro conjunto de datos para nuestros datos de producción o análisis.

Método 1: Descargar Kaggle Dataset en Jupyter Notebook

Paso 1: Descargue e instale los paquetes necesarios. 

!pip install opendatasets
pip install pandas

Paso 2: Visita www.kaggle.com . Ve a tu perfil y haz clic en cuenta. 

How to Download Kaggle Datasets into Jupyter Notebook

 

Paso 3: En la siguiente página, verá una sección de API, donde encontrará un «Crear nuevo token de API» , haga clic en él y descargará un archivo kaggle.json en el que obtendrá su nombre de usuario y clave. Usaremos el nombre de usuario y la clave en nuestro siguiente paso.

 

Paso 4: abra su Jupyter Notebook, importe la biblioteca opendatasets y descargue su conjunto de datos Kaggle pegando el enlace en él.

Python3

import opendatasets as od
import pandas
 
od.download(
    "https://www.kaggle.com/datasets/muratkokludataset/\
    acoustic-extinguisher-fire-dataset")

Producción:

 

Paso 5: Ahora estamos listos para usar nuestro conjunto de datos. 

Python3

import pandas as pds
 
# reading the XLSX file
file =('Acoustic_Extinguisher_Fire_Dataset/\
Acoustic_Extinguisher_Fire_Dataset.xlsx')
newData = pds.read_excel(file)
 
# displaying the contents of the XLSX file
newData.head()

Producción:

 

 

Método 2: descargando manualmente el conjunto de datos de Kaggle

Paso 1: visite el sitio web de Kaggle y seleccione la pestaña Conjunto de datos.

 

Paso 2 : seleccione cualquier conjunto de datos y haga clic en Descargar.

 

Paso 3: El archivo descargado estará en formato Zip, descomprímalo.

Paso 4: Cargue en su Jupyter Notebook.

 

Paso 5: ahora está listo para usar su conjunto de datos de Kaggle.

 

Publicación traducida automáticamente

Artículo escrito por surajkumarguptaintern y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *