Al analizar los conjuntos de datos reales, que a menudo tienen un tamaño muy grande, es posible que necesitemos obtener las filas o los nombres de los índices para realizar ciertas operaciones.
Analicemos cómo obtener nombres de fila en el marco de datos de Pandas .
Primero, vamos a crear un marco de datos simple connba.csv
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # calling head() method # storing in new variable data_top = data.head(10) # display data_top
Ahora intentemos obtener el nombre de la fila del conjunto de datos anterior.
Método n.º 1: simplemente iterar sobre los índices
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() # iterating the columns for row in data_top.index: print(row, end = " ")
Producción:
0 1 2 3 4 5 6 7 8 9
Método n. ° 2: usar filas con objeto de marco de datos
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() # list(data_top) or list(data_top.index)
Producción:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método n. ° 3: el index.values
método devuelve una array de index.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() list(data_top.index.values)
Producción:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método n. ° 4: uso del tolist()
método con valores dados en la lista de índice.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") # calling head() method # storing in new variable data_top = data.head() list(data_top.index.values.tolist())
Producción:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método #5: Contar el número de filas en el marco de datos
Dado que hemos cargado solo 10 filas superiores del marco de datos usando el head()
método, primero verifiquemos el número total de filas.
Python3
# iterate the indices and print each one for row in data.index: print(row, end= " ")
Producción:
Ahora, imprimamos el recuento total de index.
Python3
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("nba.csv") row_count = 0 # iterating over indices for col in data.index: row_count += 1 # print the row count print(row_count)
Producción:
458