¿Cómo dividir la columna en varias columnas en R DataFrame?

En este artículo, discutiremos cómo dividir una columna de un marco de datos en varias columnas en el lenguaje de programación R.

Método 1: Usar la función str_split_fixed() de la biblioteca de paquetes stringr

Para dividir una columna en varias columnas en el lenguaje R, usamos la función str_split_fixed() de la biblioteca de paquetes stringr. La función str_split_fixed() divide una string en un número fijo de partes. La función toma string, el término que separa la string y el número de partes en las que debe dividirse como argumentos y devuelve la string dividida.

Sintaxis:

str_split_fixed(muestra_string, patrón_separador, n)

Parámetro:

  • sample_string: determina el vector de caracteres de entrada.
  • separator_pattern: determina el patrón por el que se dividirá, según lo definido por una expresión regular POSIX.
  • n: determina el número de partes en las que se debe dividir la string.

Ejemplo: Dividir columna en múltiples columnas

R

# create sample data frame
df <- data.frame(Name=c('Priyank Mishra', 'Abhiraj Srivastava',
                        'Pawananjani Kumar'),
                 State= c("Uttar Pradesh", "Maharashtra", "Bihar"))
 
print(" Data frame before splitting: ")
df
 
# load stringr library
library(stringr)
 
# Split name column into firstname and last name
df[c('First Name', 'Last Name')] <- str_split_fixed(df$Name, ' ', 2)
 
# Rearrange columns and remove original name column
df <- df[c('First Name', 'Last Name', 'State')]
 
print(" Data frame after splitting: ")
df

Producción: 

Data frame before splitting: 
               Name         State
1     Priyank Mishra Uttar Pradesh
2 Abhiraj Srivastava   Maharashtra
3  Pawananjani Kumar         Bihar
 Data frame after splitting: 
  First Name  Last Name         State
1     Priyank     Mishra Uttar Pradesh
2     Abhiraj Srivastava   Maharashtra
3 Pawananjani      Kumar         Bihar

Método 2: usar la función de separación() de la biblioteca de paquetes dplyr

Para dividir una columna en varias columnas en el lenguaje R, usamos la función separator() de la biblioteca del paquete dplyr. La función de separación() separa una columna de caracteres en varias columnas con una expresión regular o ubicaciones numéricas. La función toma el vector de caracteres de entrada como argumento y los nombres de las columnas de salida en un vector como argumento y devuelve el vector de datos final.

Sintaxis:

separar (muestra_datos, col)

Parámetro:

  • sample_data: determina la columna del marco de datos de entrada.
  • col: determina las columnas finales que tiene que separar.

Ejemplo: Dividir columna en múltiples columnas

R

# create sample data frame
df <- data.frame(Name=c('Priyank Mishra', 'Abhiraj Srivastava',
                        'Pawananjani Kumar'),
                 State= c("Uttar Pradesh", "Maharashtra", "Bihar"))
 
print(" Data frame before splitting: ")
df
 
# load dplyr and tidyr library
library(dplyr)
library(tidyr)
 
# Split name column into firstname and last name
df <- df %>% separate(Name, c('First Name', 'Last Name'))
 
print(" Data frame after splitting: ")
df

Producción:

Data frame before splitting:
              Name         State
1     Priyank Mishra Uttar Pradesh
2 Abhiraj Srivastava   Maharashtra
3  Pawananjani Kumar         Bihar
Data frame after splitting:
 First Name  Last Name         State
1     Priyank     Mishra Uttar Pradesh
2     Abhiraj Srivastava   Maharashtra
3 Pawananjani      Kumar         Bihar

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *