Lectura de archivos CSV en Python

Un archivo CSV (valores separados por comas) es una forma de documento de texto sin formato que utiliza un formato particular para organizar la información tabular. El formato de archivo CSV es un documento de texto delimitado que usa una coma para distinguir los valores. Cada fila del documento es un registro de datos. Cada registro se compone de uno o más campos, divididos por comas. Es el formato de archivo más popular para importar y exportar hojas de cálculo y bases de datos.
 

Lectura de un archivo CSV

Hay varias formas de leer un archivo CSV que utiliza el módulo CSV o la biblioteca pandas. 

  • Módulo csv: El módulo CSV es uno de los módulos de Python que proporciona clases para leer y escribir información tabular en formato de archivo CSV.
  • Biblioteca pandas: La biblioteca pandas es una de las bibliotecas de Python de código abierto que proporciona estructuras de datos convenientes y de alto rendimiento y herramientas y técnicas de análisis de datos para la programación de Python. 
     

Lectura de un formato de archivo CSV en Python:
Considere el siguiente archivo CSV llamado ‘Giants.CSV’:
 

  • Usando csv.reader(): Al principio, el archivo CSV se abre usando el método open() en el modo ‘r’ (especifica el modo de lectura al abrir un archivo) que devuelve el objeto del archivo y luego se lee usando el lector() método del módulo CSV que devuelve el objeto lector que itera a lo largo de las líneas en el documento CSV especificado.
    Nota: La palabra clave ‘with’ se usa junto con el método open() ya que simplifica el manejo de excepciones y cierra automáticamente el archivo CSV.

Python3

import csv
 
# opening the CSV file
with open('Giants.csv', mode ='r')as file:
   
  # reading the CSV file
  csvFile = csv.reader(file)
 
  # displaying the contents of the CSV file
  for lines in csvFile:
        print(lines)

Producción:

['Organization', 'CEO', 'Established']
['Alphabet', 'Sundar Pichai', '02-Oct-15']
['Microsoft', 'Satya Nadella', '04-Apr-75']
['Amazon', 'Jeff Bezos', '05-Jul-94']

En el programa anterior, el método reader() se usa para leer el archivo Giants.csv que mapea los datos en listas.

  • Usando la clase csv.DictReader(): es similar al método anterior, el archivo CSV se abre primero usando el método open() y luego se lee usando la clase DictReader del módulo csv que funciona como un lector regular pero mapea la información en el archivo CSV en un diccionario. La primera línea del archivo consta de claves de diccionario. 

Python3

import csv
 
# opening the CSV file
with open('Giants.csv', mode ='r') as file:   
        
       # reading the CSV file
       csvFile = csv.DictReader(file)
 
       # displaying the contents of the CSV file
       for lines in csvFile:
            print(lines)

Producción:

OrderedDict([(‘Organización’, ‘Alfabeto’), (‘CEO’, ‘Sundar Pichai’), (‘Establecido’, ’02-Oct-15′)]) 
OrderedDict([(‘Organización’, ‘Microsoft’ ), (‘CEO’, ‘Satya Nadella’), (‘Establecido’, ’04-Abr-75′)]) 
OrderedDict([(‘Organización’, ‘Amazon’), (‘CEO’, ‘Jeff Bezos’ ), (‘Establecido’, ’05-Jul-94′)])

  • Usando el método pandas.read_csv(): es muy fácil y simple leer un archivo CSV usando las funciones de la biblioteca pandas. Aquí se usa el método read_csv() de la biblioteca pandas para leer datos de archivos CSV.

Python3

import pandas
 
# reading the CSV file
csvFile = pandas.read_csv('Giants.csv')
 
# displaying the contents of the CSV file
print(csvFile)

Producción:

Organization            CEO Established
0   Alphabet  Sundar Pichai   02-Oct-15
1   Microsoft  Satya Nadella   04-Apr-75
2   Amazon     Jeff Bezos   05-Jul-94

En el programa anterior, el método csv_read() de la biblioteca pandas lee el archivo Giants.csv y mapea sus datos en una lista 2D. 
Nota: Para saber más sobre pandas.csv_read() haga clic aquí .

Publicación traducida automáticamente

Artículo escrito por riturajsaha y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *