Buscar una columna de pandas para un valor

Prerrequisitos: pandas

En este artículo, analicemos cómo buscar marcos de datos para un valor específico dado usando pandas.

Función utilizada

  • where() – se usa para verificar un marco de datos para una o más condiciones y devolver el resultado en consecuencia. De forma predeterminada, las filas que no cumplen la condición se rellenan con el valor NaN.
  • dropna(): este método permite al usuario analizar y soltar filas/columnas con valores nulos. En este artículo se utiliza para tratar los casos en los que las filas tendrán un valor de NaN porque no cumplirán una determinada condición. 

Acercarse

  • Importar módulos
  • Crear datos
  • Recorra la columna buscando un valor específico
  • Si coincide, seleccione

Hay una diferencia básica entre seleccionar valores específicos y seleccionar filas que tienen un valor específico. Para el último caso, los índices a recuperar deben almacenarse en una lista. La implementación de ambos casos se incluye en este artículo:

Trama de datos en uso:

Ejemplo 1: seleccione la tupla que contiene el salario como 200

Python3

import pandas as pd
x = pd.DataFrame([["A", 100, "D"], ["B", 200, "E"], ["C", 100, "F"]],
                 columns=["Name", "Salary", "Department"])
  
# Searching in whole column
for i in range(len(x.Name)):
    if 200 == x.Salary[i]:
          
        # indx will store the tuple having that 
        # particular value in column.
        indx = i
  
# below line will print that tuple
x.iloc[indx]

Producción:

Ejemplo 2: busque personas que tengan un salario de 100 y almacene la salida en un marco de datos nuevamente. 

Python3

import pandas as pd
x = pd.DataFrame([["A", 100, "D"], ["B", 200, "E"], ["C", 100, "F"]], 
                 columns=[ "Name", "Salary", "Department"])
  
# initialize the indx as a list
indx = []
  
# Searching in whole column
for i in range(len(x.Name)):
    if 100 == x.Salary[i]:
        
        # indx will store all the tuples having 
        # that particular value in column.
        indx.append(i)
  
# Final Dataframe having tuples
df = pd.DataFrame()
  
# this will append all tuples to the final
# dataframe.
for indexes in indx:
    df = df.append(x.iloc[indexes])
  
df = x.where(x.Salary == 100)
  
# It will remove NaN rows.
df.dropna()

Producción:

Publicación traducida automáticamente

Artículo escrito por AyanChawla y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *