En este artículo, discutiremos cómo dividir una columna de un marco de datos en varias columnas en el lenguaje de programación R.
Método 1: Usar la función str_split_fixed() de la biblioteca de paquetes stringr
Para dividir una columna en varias columnas en el lenguaje R, usamos la función str_split_fixed() de la biblioteca de paquetes stringr. La función str_split_fixed() divide una string en un número fijo de partes. La función toma string, el término que separa la string y el número de partes en las que debe dividirse como argumentos y devuelve la string dividida.
Sintaxis:
str_split_fixed(muestra_string, patrón_separador, n)
Parámetro:
- sample_string: determina el vector de caracteres de entrada.
- separator_pattern: determina el patrón por el que se dividirá, según lo definido por una expresión regular POSIX.
- n: determina el número de partes en las que se debe dividir la string.
Ejemplo: Dividir columna en múltiples columnas
R
# create sample data frame df <- data.frame(Name=c('Priyank Mishra', 'Abhiraj Srivastava', 'Pawananjani Kumar'), State= c("Uttar Pradesh", "Maharashtra", "Bihar")) print(" Data frame before splitting: ") df # load stringr library library(stringr) # Split name column into firstname and last name df[c('First Name', 'Last Name')] <- str_split_fixed(df$Name, ' ', 2) # Rearrange columns and remove original name column df <- df[c('First Name', 'Last Name', 'State')] print(" Data frame after splitting: ") df
Producción:
Data frame before splitting: Name State 1 Priyank Mishra Uttar Pradesh 2 Abhiraj Srivastava Maharashtra 3 Pawananjani Kumar Bihar Data frame after splitting: First Name Last Name State 1 Priyank Mishra Uttar Pradesh 2 Abhiraj Srivastava Maharashtra 3 Pawananjani Kumar Bihar
Método 2: usar la función de separación() de la biblioteca de paquetes dplyr
Para dividir una columna en varias columnas en el lenguaje R, usamos la función separator() de la biblioteca del paquete dplyr. La función de separación() separa una columna de caracteres en varias columnas con una expresión regular o ubicaciones numéricas. La función toma el vector de caracteres de entrada como argumento y los nombres de las columnas de salida en un vector como argumento y devuelve el vector de datos final.
Sintaxis:
separar (muestra_datos, col)
Parámetro:
- sample_data: determina la columna del marco de datos de entrada.
- col: determina las columnas finales que tiene que separar.
Ejemplo: Dividir columna en múltiples columnas
R
# create sample data frame df <- data.frame(Name=c('Priyank Mishra', 'Abhiraj Srivastava', 'Pawananjani Kumar'), State= c("Uttar Pradesh", "Maharashtra", "Bihar")) print(" Data frame before splitting: ") df # load dplyr and tidyr library library(dplyr) library(tidyr) # Split name column into firstname and last name df <- df %>% separate(Name, c('First Name', 'Last Name')) print(" Data frame after splitting: ") df
Producción:
Data frame before splitting: Name State 1 Priyank Mishra Uttar Pradesh 2 Abhiraj Srivastava Maharashtra 3 Pawananjani Kumar Bihar Data frame after splitting: First Name Last Name State 1 Priyank Mishra Uttar Pradesh 2 Abhiraj Srivastava Maharashtra 3 Pawananjani Kumar Bihar
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA