Formas de filtrar Pandas DataFrame por valores de columna

En esta publicación, veremos diferentes formas de filtrar Pandas Dataframe por valores de columna. Primero, vamos a crear un marco de datos:

Python3

# importing pandas 
import pandas as pd 
    
# declare a dictionary
record = { 
  
 'Name' : ['Ankit', 'Swapnil', 'Aishwarya', 
          'Priyanka', 'Shivangi', 'Shaurya' ],
    
 'Age' : [22, 20, 21, 19, 18, 22], 
    
 'Stream' : ['Math', 'Commerce', 'Science', 
            'Math', 'Math', 'Science'], 
    
 'Percentage' : [90, 90, 96, 75, 70, 80] } 
    
# create a dataframe 
dataframe = pd.DataFrame(record,
                         columns = ['Name', 'Age', 
                                    'Stream', 'Percentage']) 
# show the Dataframe
print("Given Dataframe :\n", dataframe)

Producción:

Dataframe

Método 1: Selección de filas de Pandas Dataframe en función de un valor de columna particular utilizando el operador ‘>’, ‘=’, ‘=’, ‘<=’, ‘!=’.

Ejemplo 1: seleccionar todas las filas del marco de datos dado en el que el ‘Porcentaje’ es mayor que 75 usando [ ] .

Python3

# selecting rows based on condition 
rslt_df = dataframe[dataframe['Percentage'] > 70] 
    
print('\nResult dataframe :\n', rslt_df)

Producción:

output dataframe

Ejemplo 2: seleccionar todas las filas del marco de datos dado en el que el ‘Porcentaje’ es mayor que 70 usando loc[ ]

Python3

# selecting rows based on condition 
rslt_df = dataframe.loc[dataframe['Percentage'] > 70] 
    
print('\nResult dataframe :\n', 
      rslt_df)

Producción:

output dataframe-1

Método 2: seleccionar aquellas filas de Pandas Dataframe cuyo valor de columna está presente en la lista usando el método isin () del marco de datos.

Ejemplo 1: seleccionar todas las filas del marco de datos dado en el que ‘Stream’ está presente en la lista de opciones usando [ ] .

Python3

options = ['Science', 'Commerce'] 
    
# selecting rows based on condition 
rslt_df = dataframe[dataframe['Stream'].isin(options)] 
    
print('\nResult dataframe :\n',
      rslt_df)

Producción:

output dataframe-2

Ejemplo 2: seleccionar todas las filas del marco de datos dado en el que ‘Stream’ está presente en la lista de opciones usando loc[ ] .

Python

options = ['Science', 'Commerce'] 
    
# selecting rows based on condition 
rslt_df = dataframe.loc[dataframe['Stream'].isin(options)] 
    
print('\nResult dataframe :\n', 
      rslt_df)

Producción:

output dataframe-3

Método 3: Selección de filas de Pandas Dataframe en función de varias condiciones de columna mediante el operador ‘&’. 

Ejemplo 1: seleccionar todas las filas del marco de datos dado en el que ‘Edad’ es igual a 22 y ‘Flujo’ está presente en la lista de opciones usando [ ] .

Python3

options = ['Commerce' ,'Science'] 
    
# selecting rows based on condition 
rslt_df = dataframe[(dataframe['Age'] == 22) & 
          dataframe['Stream'].isin(options)] 
    
print('\nResult dataframe :\n',
      rslt_df)

Producción:

output dataframe-4

Ejemplo 2: seleccionar todas las filas del Dataframe dado en el que ‘Age’ es igual a 22 y ‘Stream’ está presente en la lista de opciones usando loc[ ] .

Python3

options = ['Commerce', 'Science'] 
   
# selecting rows based on condition 
rslt_df = dataframe.loc[(dataframe['Age'] == 22) & 
              dataframe['Stream'].isin(options)] 
    
print('\nResult dataframe :\n',
      rslt_df)

Producción:

output dataframe-5

Publicación traducida automáticamente

Artículo escrito por ankthon y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *