Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos. El método nsmallest()
de Pandas se usa para obtener n valores mínimos de un marco de datos o una serie.
Sintaxis: DataFrame.nsmallest (n, columnas, mantener = ‘primero’)
Parámetros:
n: int, número de valores para seleccionar
columnas: columna para verificar los valores mínimos o el usuario puede seleccionar la columna mientras llama también. [Por ejemplo: data[“age”].nsmallest(3) OR data.nsmallest(3, “age”)]
keep: object para establecer qué valor seleccionar si salen los duplicados. Las opciones son ‘primero’ o ‘último’.
Para descargar el archivo CSV utilizado, haga clic aquí.
Ejemplo #1: Extrayendo al
menos 5 valores En este ejemplo, se extraen al menos 5 valores y luego se comparan con los otros ordenados por la función sort_values().
Los valores de NaN se eliminan antes de probar este método.
Consulte sort_values y dropna() .
Python
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # removing null values data.dropna(inplace = True) # extracting least 5 least5 = data.nsmallest(5, "Salary") # display least5
Producción:
Ejemplo #2: Ordenar por sort_values()
Python
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # removing null values data.dropna(inplace = True) # sorting in ascending order data.sort_values("Salary", ascending = True, inplace = True) # displaying top 5 values data.head()
Salida:
como se muestra en la imagen de salida, los valores devueltos por ambas funciones son similares.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA