Prerrequisitos: pandas
En este artículo, analicemos cómo buscar marcos de datos para un valor específico dado usando pandas.
Función utilizada
- where() – se usa para verificar un marco de datos para una o más condiciones y devolver el resultado en consecuencia. De forma predeterminada, las filas que no cumplen la condición se rellenan con el valor NaN.
- dropna(): este método permite al usuario analizar y soltar filas/columnas con valores nulos. En este artículo se utiliza para tratar los casos en los que las filas tendrán un valor de NaN porque no cumplirán una determinada condición.
Acercarse
- Importar módulos
- Crear datos
- Recorra la columna buscando un valor específico
- Si coincide, seleccione
Hay una diferencia básica entre seleccionar valores específicos y seleccionar filas que tienen un valor específico. Para el último caso, los índices a recuperar deben almacenarse en una lista. La implementación de ambos casos se incluye en este artículo:
Trama de datos en uso:
Ejemplo 1: seleccione la tupla que contiene el salario como 200
Python3
import pandas as pd x = pd.DataFrame([["A", 100, "D"], ["B", 200, "E"], ["C", 100, "F"]], columns=["Name", "Salary", "Department"]) # Searching in whole column for i in range(len(x.Name)): if 200 == x.Salary[i]: # indx will store the tuple having that # particular value in column. indx = i # below line will print that tuple x.iloc[indx]
Producción:
Ejemplo 2: busque personas que tengan un salario de 100 y almacene la salida en un marco de datos nuevamente.
Python3
import pandas as pd x = pd.DataFrame([["A", 100, "D"], ["B", 200, "E"], ["C", 100, "F"]], columns=[ "Name", "Salary", "Department"]) # initialize the indx as a list indx = [] # Searching in whole column for i in range(len(x.Name)): if 100 == x.Salary[i]: # indx will store all the tuples having # that particular value in column. indx.append(i) # Final Dataframe having tuples df = pd.DataFrame() # this will append all tuples to the final # dataframe. for indexes in indx: df = df.append(x.iloc[indexes]) df = x.where(x.Salary == 100) # It will remove NaN rows. df.dropna()
Producción:
Publicación traducida automáticamente
Artículo escrito por AyanChawla y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA