¿Cómo agregar una fila de encabezado a un marco de datos de Pandas?

Un encabezado almacena necesariamente los nombres o encabezados de cada una de las columnas. Básicamente, ayuda al usuario a identificar el rol de la columna respectiva en el marco de datos. La fila superior que contiene los nombres de las columnas se denomina fila de encabezado del marco de datos. Básicamente, existen dos enfoques para agregar una fila de encabezado en Python en caso de que el marco de datos original no tenga un encabezado.

Método 1: crear un marco de datos a partir de un archivo CSV y crear un encabezado de fila

Al leer los datos y almacenarlos en un marco de datos, o al crear un marco de datos nuevo, los nombres de las columnas se pueden especificar mediante el atributo de nombres del método read_csv(). El atributo de nombres contiene una array de nombres para cada una de las columnas del marco de datos en orden. La longitud de la array es equivalente a la longitud de esta estructura de marco. 

Python3

# pandas package is required
import pandas as pd
 
# converting csv file to data frame
data_frame = pd.read_csv("test.txt", sep='\t',
                         names=['Name', 'Age', 'Profession'])
 
 
# printing data frame
print("Data frame")
print(data_frame)
 
# printing row header
print("Row header")
print(list(data_frame.columns))

 Producción:

También podemos especificar header=none como un atributo del método read_csv() y luego dar nombres a las columnas explícitamente cuando lo deseemos. 

Python3

# pandas package is required
import pandas as pd
 
# declaring a data frame  with three rowsand three columns
data_frame = pd.read_csv("test.txt")
 
# printing data frame
print("Original Data frame")
print(data_frame)
 
# adding column names
data_frame_new = pd.read_csv("test.txt", names=['A', 'B', 'C'])
print("New Data frame")
print(data_frame_new)
 
# printing row header
print("Row header")
print(list(data_frame_new.columns))

Producción:

Originalmente, las filas están numeradas por números de índice a partir de 0, en caso de que el archivo CSV no tenga ningún encabezado de fila. 

Método 2: crear un marco de datos y crear un encabezado de fila en Python mismo

Podemos crear un marco de datos de un número específico de filas y columnas creando primero una array multidimensional y luego convirtiéndola en un marco de datos mediante el método pandas.DataFrame(). El argumento de las columnas se utiliza para especificar el encabezado de la fila o los nombres de las columnas. Contiene una array de valores de columna con una longitud igual al número de columnas en el marco de datos. 

Python3

# pandas package is required
import pandas as pd
 
# declaring a data frame  with three rowsand three columns
data = [['Mallika', 23, 'Student'], [
    'Yash', 25, 'Tutor'], ['Abc', 14, 'Clerk']]
 
# creating a pandas data frame
data_frame = pd.DataFrame(data, columns=['Name', 'Age', 'Profession'])
 
# printing data frame
print("Data frame")
print(data_frame)
 
# printing row header
print("Row header")
 
print(list(data_frame.columns))

 Producción:

Publicación traducida automáticamente

Artículo escrito por yashkumar0457 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *