Un encabezado almacena necesariamente los nombres o encabezados de cada una de las columnas. Básicamente, ayuda al usuario a identificar el rol de la columna respectiva en el marco de datos. La fila superior que contiene los nombres de las columnas se denomina fila de encabezado del marco de datos. Básicamente, existen dos enfoques para agregar una fila de encabezado en Python en caso de que el marco de datos original no tenga un encabezado.
Método 1: crear un marco de datos a partir de un archivo CSV y crear un encabezado de fila
Al leer los datos y almacenarlos en un marco de datos, o al crear un marco de datos nuevo, los nombres de las columnas se pueden especificar mediante el atributo de nombres del método read_csv(). El atributo de nombres contiene una array de nombres para cada una de las columnas del marco de datos en orden. La longitud de la array es equivalente a la longitud de esta estructura de marco.
Python3
# pandas package is required import pandas as pd # converting csv file to data frame data_frame = pd.read_csv("test.txt", sep='\t', names=['Name', 'Age', 'Profession']) # printing data frame print("Data frame") print(data_frame) # printing row header print("Row header") print(list(data_frame.columns))
Producción:
También podemos especificar header=none como un atributo del método read_csv() y luego dar nombres a las columnas explícitamente cuando lo deseemos.
Python3
# pandas package is required import pandas as pd # declaring a data frame with three rowsand three columns data_frame = pd.read_csv("test.txt") # printing data frame print("Original Data frame") print(data_frame) # adding column names data_frame_new = pd.read_csv("test.txt", names=['A', 'B', 'C']) print("New Data frame") print(data_frame_new) # printing row header print("Row header") print(list(data_frame_new.columns))
Producción:
Originalmente, las filas están numeradas por números de índice a partir de 0, en caso de que el archivo CSV no tenga ningún encabezado de fila.
Método 2: crear un marco de datos y crear un encabezado de fila en Python mismo
Podemos crear un marco de datos de un número específico de filas y columnas creando primero una array multidimensional y luego convirtiéndola en un marco de datos mediante el método pandas.DataFrame(). El argumento de las columnas se utiliza para especificar el encabezado de la fila o los nombres de las columnas. Contiene una array de valores de columna con una longitud igual al número de columnas en el marco de datos.
Python3
# pandas package is required import pandas as pd # declaring a data frame with three rowsand three columns data = [['Mallika', 23, 'Student'], [ 'Yash', 25, 'Tutor'], ['Abc', 14, 'Clerk']] # creating a pandas data frame data_frame = pd.DataFrame(data, columns=['Name', 'Age', 'Profession']) # printing data frame print("Data frame") print(data_frame) # printing row header print("Row header") print(list(data_frame.columns))
Producción:
Publicación traducida automáticamente
Artículo escrito por yashkumar0457 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA