Mientras analizamos los conjuntos de datos reales, que a menudo tienen un tamaño muy grande, es posible que necesitemos obtener los nombres de filas o índices y nombres de columnas para realizar ciertas operaciones.
Nota: Para descargar el conjunto de datos de la NBA utilizado en los siguientes ejemplos, haga clic aquí
Obtener nombres de fila en el marco de datos de Pandas
Primero, creemos un marco de datos simple con nba.csv
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head(10) # display data_top
Producción:
Ahora intentemos obtener el nombre de la fila del conjunto de datos anterior.
Método n.º 1: simplemente iterar sobre los índices
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() # iterating the columns for row in data_top.index: print(row, end = " ")
Producción:
0 1 2 3 4 5 6 7 8 9
Método n. ° 2: usar filas con objeto de marco de datos
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() # list(data_top) or list(data_top.index)
Producción:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método #3: el método index.values devuelve una array de índices.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() list(data_top.index.values)
Producción:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método #4: Usar el método tolist() con valores dados en la lista de índices.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() list(data_top.index.values.tolist())
Producción:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método #5: Cuente el número de filas en el marco de datos
Ya que hemos cargado solo 10 filas superiores del marco de datos usando el método head(), primero verifiquemos el número total de filas.
Python3
# iterate the indices and print each one for row in data.index: print(row, end = " ")
Producción:
Ahora, imprimamos el recuento total del índice.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") row_count = 0 # iterating over indices for col in data.index: row_count += 1 # print the row count print(row_count)
Producción:
458
Obtener nombres de columnas en el marco de datos de Pandas
Ahora intentemos obtener el nombre de las columnas del conjunto de datos nba.csv.
Método #1: Simplemente iterando sobre columnas
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # iterating the columns for col in data.columns: print(col)
Producción:
Método #2: Usar columnas con objeto de marco de datos
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # list(data) or list(data.columns)
Producción:
Método #3: el método column.values devuelve una array de índices.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") list(data.columns.values)
Producción:
Método #4: Usar el método tolist() con valores con la lista de columnas dada.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") list(data.columns.values.tolist())
Producción:
Método #5: Usar el método sorted() El método
Sorted() devolverá la lista de columnas ordenadas en orden alfabético.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # using sorted() method sorted(data)
Producción: