Cree un marco de datos de Pandas a partir de una array Numpy y especifique la columna de índice y los encabezados de columna

Este artículo muestra múltiples ejemplos para convertir las arrays Numpy en Pandas Dataframe y para especificar la columna de índice y los encabezados de columna para el marco de datos.

Ejemplo 1: en este ejemplo, se generará el marco de datos de Pandas y los nombres propios de la columna de índice y los encabezados de columna se mencionarán en la función. Este enfoque se puede usar cuando no hay un patrón en el nombre de la columna de índice o los encabezados de columna. 

A continuación se muestra la implementación:

Python3

# Python program to Create a 
# Pandas DataFrame from a Numpy  
# array and specify the index 
# column and column headers
  
# import required libraries
import numpy as np
import pandas as pd
  
# creating a numpy array
numpyArray = np.array([[15, 22, 43], 
                       [33, 24, 56]])
  
# generating the Pandas dataframe
# from the Numpy array and specifying
# name of index and columns
panda_df = pd.DataFrame(data = numpyArray, 
                        index = ["Row_1", "Row_2"], 
                        columns = ["Column_1",
                                   "Column_2", "Column_3"])
  
# printing the dataframe
print(panda_df)

Producción: 

Create a Pandas DataFrame from a Numpy array and specify the index column and column headers

Ejemplo 2: en este ejemplo, la columna de índice y los encabezados de columna se generan a través de la iteración. El rango de iteraciones para filas y columnas está definido por la forma de la array Numpy. Con cada iteración, se agregará un dígito a la string predefinida y se generará la nueva columna de índice o encabezado de columna. Por lo tanto, si existe algún patrón al nombrar las etiquetas del marco de datos, este enfoque es adecuado. 

A continuación se muestra la implementación:

Python3

# Python program to Create a 
# Pandas DataFrame from a Numpy  
# array and specify the index column 
# and column headers
  
# import required libraries
import pandas as pd
import numpy as np
  
# creating a numpy array
numpyArray = np.array([[15, 22, 43], 
                       [33, 24, 56]])
  
# generating the Pandas dataframe
# from the Numpy array and specifying
# name of index and columns
panda_df = pd.DataFrame(data = numpyArray[0:, 0:],
                        index = ['Row_' + str(i + 1) 
                        for i in range(numpyArray.shape[0])],
                        columns = ['Column_' + str(i + 1) 
                        for i in range(numpyArray.shape[1])])
  
# printing the dataframe
print(panda_df)

Producción: 

Create a Pandas DataFrame from a Numpy array and specify the index column and column headers

Ejemplo 3: en este ejemplo, la columna de índice y los encabezados de columna se definen antes de convertir la array Numpy en el marco de datos de Pandas. Los nombres de las etiquetas se generan nuevamente a través de iteraciones, pero el método es un poco diferente. Aquí, el número de iteraciones se define por la longitud del subarreglo dentro del arreglo Numpy. Este método se puede usar si la columna de índice y los nombres de encabezado de columna siguen algún patrón. 

A continuación se muestra la implementación:

Python3

# Python program to Create a 
# Pandas DataFrame from a Numpy  
# array and specify the index column 
# and column headers
  
# import required libraries
import pandas as pd
import numpy as np
  
# creating a numpy array
numpyArray = np.array([[15, 22, 43], 
                       [33, 24, 56]])
  
# defining index for the 
# Pandas dataframe
index = ['Row_' + str(i) 
        for i in range(1, len(numpyArray) + 1)]
  
# defining column headers for the 
# Pandas dataframe
columns = ['Column_' + str(i) 
          for i in range(1, len(numpyArray[0]) + 1)]
  
# generating the Pandas dataframe
# from the Numpy array and specifying
# details of index and column headers
panda_df = pd.DataFrame(numpyArray , 
                        index = index,
                        columns = columns)
  
# printing the dataframe
print(panda_df)

Producción: 

Create a Pandas DataFrame from a Numpy array and specify the index column and column headers

Ejemplo #4: en este enfoque, la columna de índice y los encabezados de columna para el marco de datos de Pandas se presentarán en la array Numpy. Durante la conversión de la array Numpy en el marco de datos de Pandas, se debe realizar una indexación adecuada para las sub-arrays de la array Numpy para obtener la secuencia correcta de las etiquetas del marco de datos. 

A continuación se muestra la implementación:

Python3

# Python program to Create a 
# Pandas DataFrame from a Numpy  
# array and specify the index column 
# and column headers
  
# import required libraries
import pandas as pd
import numpy as np
  
# creating a numpy array and
# specifying the index and 
# column headers along with 
# data stored in the array
numpyArray = np.array([['', 'Column_1', 
                       'Column_2', 'Column_3'],
                       ['Row_1', 15, 22, 43],
                       ['Row_2', 33, 24, 56]])
  
# generating the Pandas dataframe
# from the Numpy array and specifying
# details of index and column headers
panda_df = pd.DataFrame(data = numpyArray[1:, 1:],
                        index = numpyArray[1:, 0],
                        columns = numpyArray[0, 1:])
  
# printing the dataframe
print(panda_df)

Producción: 

Create a Pandas DataFrame from a Numpy array and specify the index column and column headers

Publicación traducida automáticamente

Artículo escrito por RISHU_MISHRA y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *