En este artículo, analizaremos la función de mutación presente en el paquete dplyr en el lenguaje de programación R para crear, modificar y eliminar columnas de un marco de datos.
Crear nuevas columnas
Las columnas se pueden insertar agregando una nueva columna o usando columnas existentes para evaluar una nueva columna. De forma predeterminada, las columnas se agregan en el extremo derecho. Aunque las columnas se pueden agregar a cualquier posición deseada usando los argumentos .before y .after
Sintaxis:
mutar (marco de datos, columnas)
Parámetros:
- dataframe es el dataframe de entrada
- las columnas son las nuevas columnas que se agregan al marco de datos
- .antes (por defecto = NULL)
- .después (por defecto = NULL)
Ejemplo:
R
library(dplyr) # create a data frame d <- data.frame(FirstName=c("Suresh", "Ramesh", "Tanya", "Sujata"), Salary=c(50000, 60000, 70000, 80000), Expenses=c(20000, 15000, 30000, 25000)) print(d) # adding new columns d <- mutate(d, Age=c(25, 28, 22, 27), Savings=Salary - Expenses) print(d) # adding a new column before FirstName d <- mutate(d, Title=c("Mr", "Mr", "Ms", "Ms"), .before=FirstName) print(d) # adding a new column after FirstName d <- mutate(d, LastName=c("Singh", "Pande", "Sinha", "Roy"), .after=FirstName) print(d)
Producción:
FirstName Salary Expenses Suresh 50000 20000 Ramesh 60000 15000 Tanya 70000 30000 Sujata 80000 25000 FirstName Salary Expenses Age Savings Suresh 50000 20000 25 30000 Ramesh 60000 15000 28 45000 Tanya 70000 30000 22 40000 Sujata 80000 25000 27 55000 Title FirstName Salary Expenses Age Savings Mr Suresh 50000 20000 25 30000 Mr Ramesh 60000 15000 28 45000 Ms Tanya 70000 30000 22 40000 Ms Sujata 80000 25000 27 55000 Title FirstName LastName Salary Expenses Age Savings Mr Suresh Singh 50000 20000 25 30000 Mr Ramesh Pande 60000 15000 28 45000 Ms Tanya Sinha 70000 30000 22 40000 Ms Sujata Roy 80000 25000 27 55000
Eliminar columnas
Las columnas se pueden eliminar del marco de datos existente estableciendo el valor de la columna deseada en NULL .
Sintaxis:
mutar (marco de datos, columnas = NULL)
Parámetro:
- Solo se necesita un parámetro que es el nombre de la columna para ser eliminado
Ejemplo:
R
library(dplyr) # Create a data frame d <- data.frame( FirstName = c("Suresh","Ramesh","Tanya","Sujata"), Salary = c(50000,60000,70000,80000), Expenses = c(20000,15000,30000,25000)) print(d) # Delete Expenses column d <- mutate(d,Expenses = NULL) print(d)
Producción:
FirstName Salary Expenses Suresh 50000 20000 Ramesh 60000 15000 Tanya 70000 30000 Sujata 80000 25000 FirstName Salary Suresh 50000 Ramesh 60000 Tanya 70000 Sujata 80000
Modificar columnas
Las columnas existentes se pueden modificar asignando nuevos valores a las columnas deseadas.
Sintaxis:
mutar (marco de datos, nombre_columna=nuevos_valores)
Parámetros: Tomará dos parámetros
- dataframe es el dataframe de entrada
- column_name es el nombre de la columna para modificar los valores
Ejemplo:
R
library(dplyr) # Create a data frame d < - data.frame(FirstName=c("Suresh", "Ramesh", "Tanya", "Sujata"), Salary=c(50000, 60000, 70000, 80000), Expenses=c(20000, 15000, 30000, 25000)) print(d) # Modify FirstName, Salary column d < - mutate(d, FirstName=c("Mahesh", "Jignesh", "Ria", "Tanya"), Salary=c(60000, 30000, 50000, 75000)) print(d)
FirstName Salary Expenses Suresh 50000 20000 Ramesh 60000 15000 Tanya 70000 30000 Sujata 80000 25000 FirstName Salary Expenses Mahesh 60000 20000 Jignesh 30000 15000 Ria 50000 30000 Tanya 75000 25000
Publicación traducida automáticamente
Artículo escrito por ashishdhyani100 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA