¿Cómo agregar una columna vacía al marco de datos en Pandas?

En los marcos de datos, las columnas vacías se definen y representan con el valor NaN (no es un valor numérico o un valor indefinido o irrepresentable). Existen varios métodos para agregar una columna vacía a Pandas Dataframe.

Método 1: Usando el Operador de Asignación.

Este método se utiliza para asignar a la fuerza a cualquier columna un valor nulo o NaN. 

Python3

# import required libraries
import numpy as np
import pandas as pd
  
# create a Dataframe
Mydataframe = pd.DataFrame({'FirstName': ['Vipul',
                                          'Ashish',
                                          'Milan'],
                            "Age": [21,22,23]})
# show the dataframe
print("\n\n---Original Dataframe---\n", 
      Mydataframe)
  
# add an empty columns
Mydataframe['Gender'] = ''
Mydataframe['Department'] = np.nan
  
# show the dataframe
print("---Updated Dataframe---\n", 
      Mydataframe)

 Producción:

add empty column to dataframe

En el ejemplo anterior, estamos utilizando  el operador de asignación  para asignar una string vacía y un valor nulo a dos columnas recién creadas como «Género» y «Departamento», respectivamente, para los marcos de datos de pandas (tabla). La biblioteca Numpy se usa para importar el valor de NaN y usar su funcionalidad.

Método 2: Usar Dataframe.reindex().

Este método se utiliza para crear nuevas columnas en un marco de datos y asignar valor a estas columnas (si no se asigna, el nulo se asignará automáticamente).
Ejemplo : 

Python3

# import pandas library
import pandas as pd
  
# create a dataframe
Mydataframe = pd.DataFrame({'FirstName': ['Preetika',
                                          'Tanya',
                                          'Akshita'],
                            "Age": [25,21,22]})
# show the dataframe
print("---Original Dataframe---\n",
      Mydataframe)
  
# add an empty columns
Mydataframe = Mydataframe.reindex(columns = Mydataframe.columns.tolist() 
                                  + ['Gender','Roll Number'])
  
# show the dataframe
print("\n\n---Updated Dataframe---\n",
      Mydataframe)

Producción:

add empty column to dataframe-2

En el ejemplo anterior, creamos un marco de datos con dos columnas «Nombre y «Edad» y luego  usamos el método Dataframe.reindex()  para agregar dos nuevas columnas «Género» y «Número de lista» a la lista de columnas con valores NaN .

Método 3: Usar Dataframe.insert().

Este método se usa para agregar una nueva columna a un marco de datos de pandas en cualquier ubicación de índice que queramos y asignar el valor apropiado según la necesidad. 
Ejemplo: 

Python3

# import pandas library
import pandas as pd
  
# create a dataframe
Mydataframe = pd.DataFrame({'FirstName': ['Rohan',
                                          'Martin',
                                          'Mary'],
                            "Age": [28,39,21]})
# show the dataframe
print("---Original Dataframe---\n",
      Mydataframe)
  
# add an empty column
Mydataframe.insert(0,'Roll Number','')
  
# show the dataframe
print("\n\n---Updated Dataframe---\n",
      Mydataframe)

Producción:

add empty column to dataframe-3

En el ejemplo anterior, estamos usando el  método Dataframe.insert()  en marcos de datos pandas (tabla) para agregar una columna vacía «Número de rollo», aquí también podemos insertar la columna en cualquier posición de índice que queramos (como aquí colocamos el valor en la posición de índice 0).

Publicación traducida automáticamente

Artículo escrito por vipulpahuja y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *