Convierta el cursor de PyMongo en un marco de datos

Prerrequisitos: Conceptos básicos de MongoDB Python

Este artículo trata sobre cómo convertir PyMongo Cursor a Pandas Dataframe. Funciones como find() y find_one() devuelven la instancia de Cursor.

Vamos a empezar:

  1. Importación de módulos requeridos: Importe el módulo requerido usando el comando:
    from pymongo import MongoClient
    from pandas import DataFrame

    Si MongoDB ya no está instalado en su máquina, puede consultar la guía: Guía para instalar MongoDB con Python

    Si pandas no se instala, puede instalarlo usando pip y si está usando Python3, use pip3 en lugar de pip para instalar los módulos necesarios.

    pip install pandas
    
  2. Creación de una conexión: ahora que ya habíamos importado el módulo, es hora de establecer una conexión con el servidor MongoDB, presumiblemente que se ejecuta en localhost (nombre de host) en el puerto 27017 (número de puerto).
    client = MongoClient(‘localhost’, 27017)
  3. Acceso a la Base de Datos: Desde que se establece la conexión con el servidor MongoDB. Ahora podemos crear o usar la base de datos existente.
    mydatabase = client.name_of_the_database
  4. Accediendo a la Colección: Ahora seleccionamos la colección de la base de datos usando la siguiente sintaxis:
    collection_name = mydatabase.name_of_collection
  5. Obtener los documentos: obtener todos los documentos de la colección mediante el método find(). Devuelve la instancia del Cursor.
    cursor = collection_name.find()
    
  6. Convertir el cursor en marco de datos: Convertir el cursor en el marco de datos de Pandas.
    Primero, convertimos el cursor a la lista del diccionario.
    list_cur = list(cursor)
    

    Ahora, convirtiendo la lista al marco de datos

    df = DataFrame(list_cur)
    

A continuación se muestra la implementación.

Base de datos de muestra:

python-mongodb-sample-database1

# Python Program for demonstrating the 
# PyMongo Cursor to Pandas DataFrame
  
   
# Importing required modules
from pymongo import MongoClient
from pandas import DataFrame
  
   
# Connecting to MongoDB server
# client = MongoClient('host_name',
# 'port_number')
client = MongoClient('localhost', 27017)
  
# Connecting to the database named
# GFG
mydatabase = client.GFG
   
# Accessing the collection named
# gfg_collection
mycollection = mydatabase.College
  
# Now creating a Cursor instance
# using find() function
cursor = mycollection.find()
print('Type of cursor:',type(cursor))
  
# Converting cursor to the list of 
# dictionaries
list_cur = list(cursor)
  
# Converting to the DataFrame
df = DataFrame(list_cur)
print('Type of df:',type(df))
  
# Printing the df to console
print()
print(df.head())

Producción:

Type of cursor: <class 'pymongo.cursor.Cursor'>
Type of df: <class 'pandas.core.frame.DataFrame'>

   _id      name Roll No Branch
0    1  Vishwash    1001    CSE
1    2   Vishesh    1002     IT
2    3    Shivam    1003     ME
3    4      Yash    1004    ECE
4    5      Raju    1005    CSE

Publicación traducida automáticamente

Artículo escrito por sukritinpal y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *