En este artículo, veremos cómo importar conjuntos de datos de Kaggle a Google Colab.
Empezando
Aquí, cubriremos dos métodos diferentes para comenzar a trabajar con Colab. En el primer método, usaremos la API de Kaggle para descargar nuestro conjunto de datos y, después de eso, estamos listos para usar nuestro conjunto de datos. En otro método, descargamos manualmente desde el sitio web de Kaggle y usamos nuestro conjunto de datos para nuestros datos de producción o análisis. primero debe iniciar sesión en su cuenta de Google, luego vaya a este enlace https://colab.research.google.com.
Método 1: Descargar Kaggle Dataset en Jupyter Notebook
Paso 1: Abre tu terminal
Paso 2: Descargue e instale los paquetes necesarios.
pip install opendatasets pip install pandas
Paso 3: Visite www.kaggle.com. Ve a tu perfil y haz clic en cuenta.
Paso 4: En la siguiente página, verá una sección de API, donde encontrará un «Crear nuevo token de API» , haga clic en él y descargará un archivo kaggle.json en el que obtendrá su nombre de usuario y clave. Usaremos el nombre de usuario y la clave en nuestro siguiente paso.
Paso 5: importe la biblioteca de conjuntos de datos abiertos y descargue su conjunto de datos de Kaggle pegando el enlace en él.
Python3
import opendatasets as od import pandas od.download( "https://www.kaggle.com/datasets/\ muratkokludataset/acoustic-extinguisher-fire-dataset")
Producción:
Paso 6: Ahora estamos listos para usar nuestro conjunto de datos.
- Leer archivo usando archivo de Excel
- Leer archivo usando un archivo CSV
- Leer archivo usando un archivo de texto
Python3
import pandas as pds # reading the XLSX file file =('Acoustic_Extinguisher_Fire_Dataset/\ Acoustic_Extinguisher_Fire_Dataset.xlsx') newData = pds.read_excel(file) # displaying the contents of the XLSX file newData.head()
Producción:
Método 2: descargando fácilmente el conjunto de datos de Kaggle.
Paso 1: visite el sitio web de Kaggle y seleccione la pestaña Conjunto de datos.
Paso 2 : seleccione cualquier conjunto de datos y haga clic en Descargar.
Paso 3: El archivo descargado estará en formato Zip, descomprímalo.
Paso 4: Cargue su archivo o carpeta de conjunto de datos en Google Colab Notebook. Al hacer clic en Cargar su carpeta/archivo, obtendrá una opción para cargar su archivo/carpeta como se muestra en la imagen.
Paso 5: ahora hemos cargado con éxito nuestro conjunto de datos en Google Colab Notebook.
Paso 5: ahora está listo para usar su conjunto de datos de Kaggle.
Python3
import pandas as pds # reading the XLSX file file = ('Acoustic_Extinguisher_Fire_Dataset/\ Acoustic_Extinguisher_Fire_Dataset.xlsx') newData = pds.read_excel(file) # displaying the contents of the XLSX file newData.head()
Producción:
Publicación traducida automáticamente
Artículo escrito por surajkumarguptaintern y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA