En esta publicación, veremos diferentes formas de filtrar Pandas Dataframe por valores de columna. Primero, vamos a crear un marco de datos:
Python3
# importing pandas import pandas as pd # declare a dictionary record = { 'Name' : ['Ankit', 'Swapnil', 'Aishwarya', 'Priyanka', 'Shivangi', 'Shaurya' ], 'Age' : [22, 20, 21, 19, 18, 22], 'Stream' : ['Math', 'Commerce', 'Science', 'Math', 'Math', 'Science'], 'Percentage' : [90, 90, 96, 75, 70, 80] } # create a dataframe dataframe = pd.DataFrame(record, columns = ['Name', 'Age', 'Stream', 'Percentage']) # show the Dataframe print("Given Dataframe :\n", dataframe)
Producción:
Método 1: Selección de filas de Pandas Dataframe en función de un valor de columna particular utilizando el operador ‘>’, ‘=’, ‘=’, ‘<=’, ‘!=’.
Ejemplo 1: seleccionar todas las filas del marco de datos dado en el que el ‘Porcentaje’ es mayor que 75 usando [ ] .
Python3
# selecting rows based on condition rslt_df = dataframe[dataframe['Percentage'] > 70] print('\nResult dataframe :\n', rslt_df)
Producción:
Ejemplo 2: seleccionar todas las filas del marco de datos dado en el que el ‘Porcentaje’ es mayor que 70 usando loc[ ] .
Python3
# selecting rows based on condition rslt_df = dataframe.loc[dataframe['Percentage'] > 70] print('\nResult dataframe :\n', rslt_df)
Producción:
Método 2: seleccionar aquellas filas de Pandas Dataframe cuyo valor de columna está presente en la lista usando el método isin () del marco de datos.
Ejemplo 1: seleccionar todas las filas del marco de datos dado en el que ‘Stream’ está presente en la lista de opciones usando [ ] .
Python3
options = ['Science', 'Commerce'] # selecting rows based on condition rslt_df = dataframe[dataframe['Stream'].isin(options)] print('\nResult dataframe :\n', rslt_df)
Producción:
Ejemplo 2: seleccionar todas las filas del marco de datos dado en el que ‘Stream’ está presente en la lista de opciones usando loc[ ] .
Python
options = ['Science', 'Commerce'] # selecting rows based on condition rslt_df = dataframe.loc[dataframe['Stream'].isin(options)] print('\nResult dataframe :\n', rslt_df)
Producción:
Método 3: Selección de filas de Pandas Dataframe en función de varias condiciones de columna mediante el operador ‘&’.
Ejemplo 1: seleccionar todas las filas del marco de datos dado en el que ‘Edad’ es igual a 22 y ‘Flujo’ está presente en la lista de opciones usando [ ] .
Python3
options = ['Commerce' ,'Science'] # selecting rows based on condition rslt_df = dataframe[(dataframe['Age'] == 22) & dataframe['Stream'].isin(options)] print('\nResult dataframe :\n', rslt_df)
Producción:
Ejemplo 2: seleccionar todas las filas del Dataframe dado en el que ‘Age’ es igual a 22 y ‘Stream’ está presente en la lista de opciones usando loc[ ] .
Python3
options = ['Commerce', 'Science'] # selecting rows based on condition rslt_df = dataframe.loc[(dataframe['Age'] == 22) & dataframe['Stream'].isin(options)] print('\nResult dataframe :\n', rslt_df)
Producción: