Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
El método de Pandas nlargest()
se usa para obtener n valores más grandes de un marco de datos o una serie.
Sintaxis:
DataFrame.nlargest(n, columns, keep='first')
Parámetros:
n: int, Número de valores para seleccionar
columnas: Columna para verificar valores o el usuario puede seleccionar la columna mientras llama también. [Por ejemplo: data[“edad”].nsmallest(3) O data.nsmallest(3, “edad”)]mantener: objeto para establecer qué valor seleccionar si salen los duplicados. Las opciones son ‘primero’ o ‘último’
Para descargar el archivo CSV utilizado, haga clic aquí.
Código #1: Extracción de los 5 valores más grandes
En este ejemplo, los 5 valores más grandes se extraen y luego se comparan con los otros ordenados por la función sort_values(). Los valores de NaN se eliminan antes de probar este método.
Consulte la función sort_values y dropna() .
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # removing null values data.dropna(inplace = True) # extracting greatest 5 large5 = data.nlargest(5, "Salary") # display large5
Producción:
Código #2: Ordenar por sort_values()
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # removing null values data.dropna(inplace = True) # sorting in descending order data.sort_values("Salary", ascending = False, inplace = True) # displaying top 5 values data.head()
Producción:
Como se muestra en la imagen de salida, los valores devueltos por ambas funciones son similares.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA