Este artículo muestra múltiples ejemplos para convertir las arrays Numpy en Pandas Dataframe y para especificar la columna de índice y los encabezados de columna para el marco de datos.
Ejemplo 1: en este ejemplo, se generará el marco de datos de Pandas y los nombres propios de la columna de índice y los encabezados de columna se mencionarán en la función. Este enfoque se puede usar cuando no hay un patrón en el nombre de la columna de índice o los encabezados de columna.
A continuación se muestra la implementación:
Python3
# Python program to Create a # Pandas DataFrame from a Numpy # array and specify the index # column and column headers # import required libraries import numpy as np import pandas as pd # creating a numpy array numpyArray = np.array([[15, 22, 43], [33, 24, 56]]) # generating the Pandas dataframe # from the Numpy array and specifying # name of index and columns panda_df = pd.DataFrame(data = numpyArray, index = ["Row_1", "Row_2"], columns = ["Column_1", "Column_2", "Column_3"]) # printing the dataframe print(panda_df)
Producción:
Ejemplo 2: en este ejemplo, la columna de índice y los encabezados de columna se generan a través de la iteración. El rango de iteraciones para filas y columnas está definido por la forma de la array Numpy. Con cada iteración, se agregará un dígito a la string predefinida y se generará la nueva columna de índice o encabezado de columna. Por lo tanto, si existe algún patrón al nombrar las etiquetas del marco de datos, este enfoque es adecuado.
A continuación se muestra la implementación:
Python3
# Python program to Create a # Pandas DataFrame from a Numpy # array and specify the index column # and column headers # import required libraries import pandas as pd import numpy as np # creating a numpy array numpyArray = np.array([[15, 22, 43], [33, 24, 56]]) # generating the Pandas dataframe # from the Numpy array and specifying # name of index and columns panda_df = pd.DataFrame(data = numpyArray[0:, 0:], index = ['Row_' + str(i + 1) for i in range(numpyArray.shape[0])], columns = ['Column_' + str(i + 1) for i in range(numpyArray.shape[1])]) # printing the dataframe print(panda_df)
Producción:
Ejemplo 3: en este ejemplo, la columna de índice y los encabezados de columna se definen antes de convertir la array Numpy en el marco de datos de Pandas. Los nombres de las etiquetas se generan nuevamente a través de iteraciones, pero el método es un poco diferente. Aquí, el número de iteraciones se define por la longitud del subarreglo dentro del arreglo Numpy. Este método se puede usar si la columna de índice y los nombres de encabezado de columna siguen algún patrón.
A continuación se muestra la implementación:
Python3
# Python program to Create a # Pandas DataFrame from a Numpy # array and specify the index column # and column headers # import required libraries import pandas as pd import numpy as np # creating a numpy array numpyArray = np.array([[15, 22, 43], [33, 24, 56]]) # defining index for the # Pandas dataframe index = ['Row_' + str(i) for i in range(1, len(numpyArray) + 1)] # defining column headers for the # Pandas dataframe columns = ['Column_' + str(i) for i in range(1, len(numpyArray[0]) + 1)] # generating the Pandas dataframe # from the Numpy array and specifying # details of index and column headers panda_df = pd.DataFrame(numpyArray , index = index, columns = columns) # printing the dataframe print(panda_df)
Producción:
Ejemplo #4: en este enfoque, la columna de índice y los encabezados de columna para el marco de datos de Pandas se presentarán en la array Numpy. Durante la conversión de la array Numpy en el marco de datos de Pandas, se debe realizar una indexación adecuada para las sub-arrays de la array Numpy para obtener la secuencia correcta de las etiquetas del marco de datos.
A continuación se muestra la implementación:
Python3
# Python program to Create a # Pandas DataFrame from a Numpy # array and specify the index column # and column headers # import required libraries import pandas as pd import numpy as np # creating a numpy array and # specifying the index and # column headers along with # data stored in the array numpyArray = np.array([['', 'Column_1', 'Column_2', 'Column_3'], ['Row_1', 15, 22, 43], ['Row_2', 33, 24, 56]]) # generating the Pandas dataframe # from the Numpy array and specifying # details of index and column headers panda_df = pd.DataFrame(data = numpyArray[1:, 1:], index = numpyArray[1:, 0], columns = numpyArray[0, 1:]) # printing the dataframe print(panda_df)
Producción:
Publicación traducida automáticamente
Artículo escrito por RISHU_MISHRA y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA