La iteración es un término general para tomar cada elemento de algo, uno tras otro. Pandas DataFrame consta de filas y columnas, por lo que, para iterar sobre el marco de datos, tenemos que iterar un marco de datos como un diccionario. En un diccionario, iteramos sobre las claves del objeto de la misma manera que tenemos que iterar en el marco de datos.
En este artículo, estamos usando el archivo «nba.csv» para descargar el CSV, haga clic aquí .
En Pandas Dataframe podemos iterar un elemento de dos formas:
- Iterando sobre filas
- Iterando sobre columnas
Iterando sobre filas:
Para iterar sobre filas, podemos usar tres funciones iteritems(), iterrows(), itertuples() . Estas tres funciones ayudarán en la iteración sobre las filas.
Iteración sobre filas usando iterrows()
Para iterar sobre las filas, aplicamos una función iterrows(), esta función devuelve cada valor de índice junto con una serie que contiene los datos en cada fila.
Código #1:
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from a dictionary df = pd.DataFrame(dict) print(df)
Ahora aplicamos la función iterrows() para obtener cada elemento de las filas.
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from a dictionary df = pd.DataFrame(dict) # iterating over rows using iterrows() function for i, j in df.iterrows(): print(i, j) print()
Producción:
Código #2:
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") # for data visualization we filter first 3 datasets data.head(3)
Ahora aplicamos un iterrows para obtener cada elemento de las filas en el marco de datos
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") for i, j in data.iterrows(): print(i, j) print()
Producción:
Iteración sobre filas usando iteritems()
Para iterar sobre las filas, usamos la función iteritems(). Esta función itera sobre cada columna como clave, el par de valores con la etiqueta como clave y el valor de la columna como un objeto Serie.
Código #1:
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from a dictionary df = pd.DataFrame(dict) print(df)
Ahora aplicamos una función iteritems() para recuperar filas de marco de datos.
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from a dictionary df = pd.DataFrame(dict) # using iteritems() function to retrieve rows for key, value in df.iteritems(): print(key, value) print()
Producción:
Código #2:
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") # for data visualization we filter first 3 datasets data.head(3)
Producción:
Ahora aplicamos iteritems() para recuperar filas de un marco de datos
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") for key, value in data.iteritems(): print(key, value) print()
Producción:
Iteración sobre filas usando itertuples()
Para iterar sobre las filas, aplicamos una función itertuples() esta función devuelve una tupla para cada fila en el DataFrame. El primer elemento de la tupla será el valor de índice correspondiente de la fila, mientras que los valores restantes son los valores de fila.
Código #1:
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from a dictionary df = pd.DataFrame(dict) print(df)
Ahora aplicamos una función itertuples() para obtener una tupla para cada fila
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from dictionary df = pd.DataFrame(dict) # using a itertuples() for i in df.itertuples(): print(i)
Producción:
Código #2:
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") # for data visualization we filter first 3 datasets data.head(3)
Ahora aplicamos itertuples() para obtener una duplicación de cada fila
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") for i in data.itertuples(): print(i)
Producción:
Iterando sobre Columnas:
Para iterar sobre las columnas, necesitamos crear una lista de columnas del marco de datos y luego iterar a través de esa lista para extraer las columnas del marco de datos.
Código #1:
Python3
# importing pandas as pd import pandas as pd # dictionary of lists dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} # creating a dataframe from a dictionary df = pd.DataFrame(dict) print(df)
Ahora iteramos a través de las columnas para iterar a través de las columnas, primero creamos una lista de columnas de marco de datos y luego iteramos a través de la lista.
Python
# creating a list of dataframe columns columns = list(df) for i in columns: # printing the third element of the column print (df[i][2])
Producción:
Código #2:
Python
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv") # for data visualization we filter first 3 datasets col = data.head(3) col
Ahora iteramos sobre las columnas en el archivo CSV para iterar sobre las columnas, creamos una lista de columnas de marco de datos e iteramos sobre la lista
Python
# creating a list of dataframe columns clmn = list(col) for i in clmn: # printing a third element of column print(col[i][2])
Producción:
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA