En este artículo, discutiremos cómo crear una variable de clasificación con el paquete Dplyr en R.
Instalación
Para instalar este paquete, escriba el siguiente comando en la terminal.
install.packages("dplyr")
El método de mutación se puede utilizar para reorganizar los datos en una orientación diferente realizando varios métodos agregados y estadísticos y asignándolos a nuevos nombres de columna del marco de datos.
Sintaxis:
mutate(new-col-name = function(col-name))
El método desc() se puede utilizar para organizar los datos en orden descendente. Es el método agregado incorporado disponible en R. Sin embargo, junto con un signo – delante de la columna, se usa para asignar la variable de clasificación en orden ascendente.
Sintaxis:
desc(col-name)
El método dense_rank se puede aplicar para devolver el rango de filas dentro de una partición de ventana, sin espacios. Toma como argumento el nombre de la columna del marco de datos. A la variable con el mismo valor se le asigna el mismo rango independientemente del número de veces que aparece dentro de la columna del marco de datos.
Ejemplo 1:
R
library(data.table) library(dplyr) # creating first data frame data_frame < - data.table(col1=rep(c(5: 7), each=2), col2=c(1, 4, 3, 4, 1, 6), col3=1 ) print("Original DataFrame") print(data_frame) # ranking variable in data frame print("Modified DataFrame") # ranking by column 2 data_frame % > % mutate(rank=dense_rank(desc(-col2)))
Producción
[1] "Original DataFrame" col1 col2 col3 1: 5 1 1 2: 5 4 1 3: 6 3 1 4: 6 4 1 5: 7 1 1 6: 7 6 1 [1] "Modified DataFrame" col1 col2 col3 rank 1: 5 1 1 1 2: 5 4 1 3 3: 6 3 1 2 4: 6 4 1 3 5: 7 1 1 1 6: 7 6 1 4
Ejemplo 2: asigna los rangos en orden descendente
El rango de la variable de nombre de columna también se puede organizar en el marco de datos sin un signo menos, lo que asigna los rangos en orden descendente.
R
library(data.table) library(dplyr) # creating first data frame data_frame < - data.table(col1=rep(c(5: 7), each=2), col2=c(1, 4, 3, 4, 1, 6), col3=1 ) print("Original DataFrame") print(data_frame) # ranking variable in data frame print("Modified DataFrame") data_frame % > % mutate(rank=dense_rank(desc(col2)))
Producción
[1] "Original DataFrame" col1 col2 col3 1: 5 1 1 2: 5 4 1 3: 6 3 1 4: 6 4 1 5: 7 1 1 6: 7 6 1 [1] "Modified DataFrame" col1 col2 col3 rank 1: 5 1 1 4 2: 5 4 1 2 3: 6 3 1 3 4: 6 4 1 2 5: 7 1 1 4 6: 7 6 1 1
Publicación traducida automáticamente
Artículo escrito por yashkumar0457 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA