CSV significa valores separados por comas y los archivos CSV son esencialmente archivos de texto que se utilizan para almacenar datos de forma tabular utilizando comas (,) como delimitadores. CSV es un formato de archivo y todos los archivos de este formato se almacenan con una extensión .csv. Es un formato muy popular y ampliamente utilizado para almacenar datos de forma estructurada. Los archivos CSV encuentran muchas aplicaciones en el aprendizaje automático y los modelos estadísticos. Python tiene una biblioteca dedicada a manejar operaciones que atienden a archivos CSV, como leerlos, escribirlos o modificarlos. El siguiente es un ejemplo de cómo se ve un archivo CSV.
Este artículo trata sobre las diferentes formas de obtener nombres de columna de archivos CSV usando Python. Los siguientes enfoques se pueden utilizar para lograr lo mismo:
- Uso de la biblioteca CSV de Python para leer la línea y la línea del archivo CSV e imprimir el encabezado como los nombres de las columnas
- Leer el archivo CSV como un diccionario usando DictReader y luego imprimir las claves del diccionario
- Convertir el archivo CSV en un marco de datos utilizando la biblioteca Pandas de Python
Método 1:
Usando este enfoque, primero leemos el archivo CSV usando la biblioteca CSV de Python y luego generamos la primera fila que representa los nombres de las columnas.
Python3
# importing the csv library import csv # opening the csv file by specifying # the location # with the variable name as csv_file with open('data.csv') as csv_file: # creating an object of csv reader # with the delimiter as , csv_reader = csv.reader(csv_file, delimiter = ',') # list to store the names of columns list_of_column_names = [] # loop to iterate through the rows of csv for row in csv_reader: # adding the first row list_of_column_names.append(row) # breaking the loop after the # first iteration itself break # printing the result print("List of column names : ", list_of_column_names[0])
Producción:
List of column names : ['Column1', 'Column2', 'Column3']
Método 2:
Bajo el segundo enfoque, usamos la función DictReader de la biblioteca CSV para leer el archivo CSV como un diccionario. Simplemente podemos usar el método keys() para obtener los nombres de las columnas.
Pasos :
- Abra el archivo CSV usando DictReader.
- Convierta este archivo en una lista.
- Convierte la primera fila de la lista al diccionario.
- Llame al método keys() del diccionario y conviértalo en una lista.
- Muestre la lista.
Python3
# importing the csv library import csv # opening the csv file with open('data.csv') as csv_file: # reading the csv file using DictReader csv_reader = csv.DictReader(csv_file) # converting the file to dictionary # by first converting to list # and then converting the list to dict dict_from_csv = dict(list(csv_reader)[0]) # making a list from the keys of the dict list_of_column_names = list(dict_from_csv.keys()) # displaying the list of column names print("List of column names : ", list_of_column_names)
Producción :
List of column names : ['Column1', 'Column2', 'Column3']
Método 3:
Bajo este enfoque, leemos el archivo CSV como un marco de datos utilizando la biblioteca pandas de Python. Luego, simplemente llamamos al método de la columna del marco de datos.
Python3
# importing the pandas library import pandas as pd # reading the csv file using read_csv # storing the data frame in variable called df df = pd.read_csv('data.csv') # creating a list of column names by # calling the .columns list_of_column_names = list(df.columns) # displaying the list of column names print('List of column names : ', list_of_column_names)
Producción :
List of column names : ['Column1', 'Column2', 'Column3']
El marco de datos se ve de la siguiente manera:
Publicación traducida automáticamente
Artículo escrito por ag01harshit y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA