Crear marco de datos con espacios en nombres de columna en R

En este artículo, veremos cómo crear un DataFrame con espacios en los nombres de las columnas en el lenguaje de programación R.

Método 1: usar el atributo check.names

El método data.frame() en R se puede usar para crear un marco de datos con filas y columnas individuales en R. Este método contiene un atributo check.names, que se establece de forma predeterminada en TRUE al realizar esta llamada. La función de este atributo es validar que los nombres asignados a la variable sean sintácticamente válidos. También asegura que los nombres no se dupliquen. En caso de existir alguna violación en los nombres asignados, estos son ajustados implícitamente por el atributo make.names. 

El atributo make.names asignó nombres de string permitidos a las columnas del marco de datos, donde cualquier carácter no válido se transforma en un ‘.’ Toma como entrada un vector de caracteres y devuelve la salida como un vector de caracteres de la misma longitud donde cada valor de celda se coacciona a un nombre legal. 

Un nombre sintácticamente válido consta de letras, números y los caracteres de punto o subrayado y comienza con una letra o el punto no seguido de un número.

Sintaxis:

make.names(nombres, únicos=FALSO)

Ejemplo:

R

# declaring a data frame in R
data_frame = data.frame("Col Num  1"= c(1, 2, NA, 0), 
                        "Col Num  2"= c( NA, NA, 3, 8), 
                        "Col Num  3"= c("A", "V", "j", "y"))
  
print("Original data frame")
print(data_frame)
  
# printing spaces unmodified
data_frame_mod = data.frame("Col Num  1"= c(1, 2, NA, 0), 
                            "Col Num  2"= c( NA, NA, 3, 8), 
                            "Col Num  3"= c("A", "V", "j", "y"),
                            check.names=FALSE)
print("Modified data frame")
print(data_frame_mod)

Producción

[1] "Original data frame"
  Col.Num..1 Col.Num..2 Col.Num..3
1          1         NA          A
2          2         NA          V
3         NA          3          j
4          0          8          y
[1] "Modified data frame"
  Col Num  1 Col Num  2 Col Num  3
1          1         NA          A
2          2         NA          V
3         NA          3          j
4          0          8          y

Método 2: Usar el método colnames()

El método colnames() en R se usa para asignar nombres de columna al marco de datos en R. Se usa para reescribir los valores existentes asignados a las columnas. Toma como entrada un vector de caracteres que consta de strings que se utilizarán para los nombres de las columnas, con una longitud equivalente al número de columnas en lenguaje R. Dado que el espacio es un carácter válido en la string, la asignación de nombres de columnas realizada con este método acepta espacios en los nombres. 

Inicialmente, los nombres de las columnas se convierten usando la función de atributo make.names, pero los valores se sobrescriben usando la asignación del vector de string a colnames() del marco de datos. 

Ejemplo:

R

# declaring a data frame in R
data_frame = data.frame("Col Num  1"= c(1, 2, NA, 0), 
                        "Col Num  2"= c( NA, NA, 3, 8), 
                        "Col Num  3"= c("A", "V", "j", "y"))
print("Original data frame")
print(data_frame)
  
# defining column names using vector
colnames(data_frame) = c("Col Num  1","Col Num  2","Col Num  3")
  
# printing modified data frame
print("Modified data frame")
print(data_frame)

Producción

[1] "Original data frame"
  Col.Num..1 Col.Num..2 Col.Num..3
1          1         NA          A
2          2         NA          V
3         NA          3          j
4          0          8          y
[1] "Modified data frame"
  Col Num  1 Col Num  2 Col Num  3
1          1         NA          A
2          2         NA          V
3         NA          3          j
4          0          8          y

Método 3: Usar el método de nombres()

El método names() en R se puede usar como getter o setter para cualquier objeto R. Toma como argumento el objeto que se necesita nombrar y el lado derecho es un vector con la longitud equivalente a la longitud del objeto a renombrar, marco de datos en este caso. Su uso es completamente similar al método colnames(). 

Sintaxis:

nombres(df) <- c(…,..)

R

# declaring a data frame in R
data_frame = data.frame("Col Num  1"= c(1, 2, NA, 0), 
                        "Col Num  2"= c( NA, NA, 3, 8), 
                        "Col Num  3"= c("A", "V", "j", "y"))
print("Original data frame")
print(data_frame)
  
# defining column names using vector
names(data_frame) = c("Col Num  1","Col Num  2","Col Num  3")
  
# printing modified data frame
print("Modified data frame")
print(data_frame)

Producción

[1] "Original data frame"
 Col.Num..1 Col.Num..2 Col.Num..3
1          1         NA          A
2          2         NA          V
3         NA          3          j
4          0          8          y
[1] "Modified data frame"
 Col Num  1 Col Num  2 Col Num  3
1          1         NA          A
2          2         NA          V
3         NA          3          j
4          0          8          y

Publicación traducida automáticamente

Artículo escrito por mallikagupta90 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *