Cómo importar conjuntos de datos de Kaggle directamente a Google Colab

En este artículo, veremos cómo importar conjuntos de datos de Kaggle a Google Colab.

Empezando

Aquí, cubriremos dos métodos diferentes para comenzar a trabajar con Colab. En el primer método, usaremos la API de Kaggle para descargar nuestro conjunto de datos y, después de eso, estamos listos para usar nuestro conjunto de datos. En otro método, descargamos manualmente desde el sitio web de Kaggle y usamos nuestro conjunto de datos para nuestros datos de producción o análisis. primero debe iniciar sesión en su cuenta de Google, luego vaya a este enlace https://colab.research.google.com.

Método 1: Descargar Kaggle Dataset en Jupyter Notebook

Paso 1: Abre tu terminal

 

Paso 2: Descargue e instale los paquetes necesarios. 

pip install opendatasets
pip install pandas

 

Paso 3: Visite www.kaggle.com. Ve a tu perfil y haz clic en cuenta. 

 

Paso 4: En la siguiente página, verá una sección de API, donde encontrará un «Crear nuevo token de API» , haga clic en él y descargará un archivo kaggle.json en el que obtendrá su nombre de usuario y clave. Usaremos el nombre de usuario y la clave en nuestro siguiente paso.

 

Paso 5: importe la biblioteca de conjuntos de datos abiertos y descargue su conjunto de datos de Kaggle pegando el enlace en él.

Python3

import opendatasets as od
import pandas
  
od.download(
    "https://www.kaggle.com/datasets/\
    muratkokludataset/acoustic-extinguisher-fire-dataset")

Producción:

 

Paso 6: Ahora estamos listos para usar nuestro conjunto de datos. 

Python3

import pandas as pds
  
# reading the XLSX file
file =('Acoustic_Extinguisher_Fire_Dataset/\
Acoustic_Extinguisher_Fire_Dataset.xlsx')
newData = pds.read_excel(file)
  
# displaying the contents of the XLSX file
newData.head()

Producción:

 

 

Método 2: descargando fácilmente el conjunto de datos de Kaggle.

Paso 1: visite el sitio web de Kaggle y seleccione la pestaña Conjunto de datos.

 

Paso 2 : seleccione cualquier conjunto de datos y haga clic en Descargar.

 

Paso 3: El archivo descargado estará en formato Zip, descomprímalo.

Paso 4: Cargue su archivo o carpeta de conjunto de datos en Google Colab Notebook. Al hacer clic en Cargar su carpeta/archivo, obtendrá una opción para cargar su archivo/carpeta como se muestra en la imagen.

 

Paso 5: ahora hemos cargado con éxito nuestro conjunto de datos en Google Colab Notebook.

 

Paso 5: ahora está listo para usar su conjunto de datos de Kaggle.

Python3

import pandas as pds
  
# reading the XLSX file
file = ('Acoustic_Extinguisher_Fire_Dataset/\
            Acoustic_Extinguisher_Fire_Dataset.xlsx')
  
newData = pds.read_excel(file)
  
# displaying the contents of the XLSX file
newData.head()

Producción:

 

Publicación traducida automáticamente

Artículo escrito por surajkumarguptaintern y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *