Requisito previo: Pandas DataFrame.sort_values() | Serie 1
Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
La función Pandas sort_values()
ordena un marco de datos en orden ascendente o descendente de la columna pasada. Es diferente a la función ordenada de Python, ya que no puede ordenar un marco de datos y no se puede seleccionar una columna en particular.
Analicemos la Dataframe.sort_values()
clasificación de parámetros múltiples :
Sintaxis:
DataFrame.sort_values(by, axis=0, ascendente=True, inplace=False, kind=’quicksort’, na_position=’last’)
Para obtener un enlace al archivo CSV utilizado en el código, haga clic aquí.
Ejemplo #1: Ordenar por Nombre y Equipo
En el siguiente ejemplo, se crea un marco de datos a partir del archivo csv y el marco de datos se ordena en orden ascendente de Equipo y en cada Equipo el Nombre también se ordena en orden Ascendente.
Antes de clasificar –
#importing pandas package import pandas as pd #making data frame from csv file data=pd.read_csv("nba.csv") #sorting data frame by Team and then By names data.sort_values(["Team", "Name"], axis=0, ascending=True, inplace=True) #display data
Salida:
después de ordenar –
#importing pandas package import pandas as pd #making data frame from csv file data=pd.read_csv("nba.csv") #sorting data frame by Team and then By names data.sort_values(["Team", "Name"], axis=0, ascending=True, inplace=True) #display data
Como se muestra en la imagen, el equipo se ordena primero en orden ascendente y luego los nombres se ordenan en orden ascendente para cada nombre de equipo.
Example #2: Passing list to Ascending Parameter
Como se muestra en el ejemplo anterior, un marco de datos se puede ordenar con respecto a varias columnas pasando una lista al parámetro ‘por’. También podemos pasar una lista al parámetro ‘ascendente’ para decirle a los pandas qué columna ordenar cómo.
El índice de Boolean en el parámetro ‘ascendente’ debe ser el mismo que el índice del nombre de la columna en el parámetro ‘by’.
#importing pandas package import pandas as pd #making data frame from csv file data=pd.read_csv("nba.csv") #sorting data frame by Team and then By names data.sort_values(["Team", "Name"], axis=0, ascending=[True,False], inplace=True) #display data
Como se muestra en la imagen a continuación, el marco de datos se ordena de forma ascendente según el nombre del equipo y, para cada nombre de equipo, los nombres se ordenan de forma descendente.
Ejemplo #3: Clasificación usando 3 Columnas
En el siguiente ejemplo, el mismo marco de datos se ordena por nombre de equipo. Para cada equipo, el marco de datos se ordena por edad y para cada misma edad, el marco de datos se ordena por altura. Este ejemplo explicará cómo funciona la clasificación multiparamétrica en Data Frame.
#importing pandas package import pandas as pd #making data frame from csv file data=pd.read_csv("nba.csv") #sorting data frame by Team, age and height data.sort_values(["Team", "Age", "Height"], axis=0, ascending=[False,True,False], inplace=True) #display data
Como se muestra en la imagen, primero se ordena el nombre del equipo, luego la edad y, para cada edad, se ordena la altura. En el Equipo “Washington Wizards” hay 3 Jugadores con 30 años de edad. Esas 3 personas están ordenadas por su Altura en orden ascendente.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA