Agregar ID de índice a DataFrame en R

En este artículo, analizaremos cómo se puede agregar el ID de índice a los marcos de datos en el lenguaje de programación R.

Método 1: usar los métodos  cbind() y nrow()

El método nrow() en el lenguaje de programación R se utiliza para calcular el número de filas en el marco de datos que se especifica como argumento de este método. El método cbind() en lenguaje R se usa para agregar un vector al marco de datos. El vector se agrega al marco de datos en el orden en que se especifica durante la llamada a la función. Para liderar el dataframe con un vector id, se utilizará la siguiente sintaxis:

cbind(vec , data_frame)

La longitud del vector debe ser equivalente al número de filas en el marco de datos. 

Ejemplo:

R

# declaring a data frame in R
data_frame <- data.frame(x1 = 2:7,            
                   x2 = letters[1:6],
                   x3 = 6,
                   row.names = c('I','II','III','IV','V','VI'))
 
print("Original Data Frame")                  
print(data_frame)
 
# number of rows in data frame
num_rows = nrow(data_frame)
  
# creating ID column vector
ID <- c(1:num_rows)
 
# binding id column to the data frame
data_frame1 <- cbind(ID , data_frame)
 
print("Modified Data Frame")
print (data_frame1)

Producción

[1] "Original Data Frame"
   x1 x2 x3
I    2  a  6
II   3  b  6
III  4  c  6
IV   5  d  6
V    6  e  6
VI   7  f  6
[1] "Modified Data Frame"
   ID x1 x2 x3
I    1  2  a  6
II   2  3  b  6
III  3  4  c  6
IV   4  5  d  6
V    5  6  e  6
VI   6  7  f  6

Método 2: asignar nombres de fila como ID de índice en el marco de datos

Para liderar un marco de datos con la columna de ID de índice, también podemos reasignar los nombres de fila del marco de datos para reflejar los valores enteros crecientes a partir de 1 hasta el número de filas en el marco de datos. El método rownames(df) se utiliza para asignar los nombres de las filas. Todos los cambios se reflejan en el marco de datos original. 

Ejemplo:

R

# declaring a data frame in R
data_frame <- data.frame(x1 = 2:7,            
                   x2 = letters[1:6],
                   x3 = 6,
                   row.names = c('I','II','III','IV','V','VI')
                  )
 
print("Original Data Frame")                  
print(data_frame)
 
# number of rows in data frame
num_rows = nrow(data_frame)
 
# changing row names of the data frame
rownames(data_frame) <- c(1:num_rows)
 
print("Modified Data Frame")
print (data_frame)

Producción

[1] "Original Data Frame"
   x1 x2 x3
I    2  a  6
II   3  b  6
III  4  c  6
IV   5  d  6
V    6  e  6
VI   7  f  6
[1] "Modified Data Frame"
 x1 x2 x3
1  2  a  6
2  3  b  6
3  4  c  6
4  5  d  6
5  6  e  6
6  7  f  6

Método 3: Usar el método seq.int()

El método seq.int() en R se usa para generar secuencias enteras que comienzan desde 1 hasta el número x especificado como argumento de la función. Los nombres de las filas han pertenecido. La columna recién agregada se agrega al final del marco de datos. 

Sintaxis:

seq.int(x)

Ejemplo:

R

# declaring a data frame in R
data_frame <- data.frame(x1 = 2:7,            
                   x2 = letters[1:6],
                   x3 = 6,
                   row.names = c('I','II','III','IV','V','VI')
                  )
 
print("Original Data Frame")                  
print(data_frame)
 
# number of rows in data frame
num_rows = nrow(data_frame)
 
# creating ID column vector
data_frame$ID <- seq.int(num_rows)
 
print("Modified Data Frame")
print (data_frame)

Producción

[1] "Original Data Frame"
   x1 x2 x3
I    2  a  6
II   3  b  6
III  4  c  6
IV   5  d  6
V    6  e  6
VI   7  f  6
[1] "Modified Data Frame"
   x1 x2 x3 ID
I    2  a  6  1
II   3  b  6  2
III  4  c  6  3
IV   5  d  6  4
V    6  e  6  5
VI   7  f  6  6

Método 4: usar la biblioteca dplyr 

El método de mutación del paquete dplyr se puede usar para agregar, eliminar y modificar más datos en el objeto de marco de datos incluido. Para agregar una nueva columna, se puede usar la siguiente variante del método de mutación: 

Sintaxis:

mutar (nuevo-col-nombre = lógica)

donde la lógica especifica la condición sobre la cual se basa la adición de datos

Aquí, el método row_number() se usa para proporcionar una secuencia creciente de números enteros para almacenar números de fila. La columna recién agregada se agrega al final del objeto de datos existente.

Ejemplo:

R

library(dplyr)
 
data_frame <- data.frame(x1 = 2:7,            
                         x2 = letters[1:6],
                         x3 = 6
                         )
 
print("Original Data Frame")                  
print(data_frame)
 
data_frame <- data_frame %>% mutate(ID = row_number())
 
print("Modified Data Frame")                  
print(data_frame)

Producción

[1] "Original Data Frame" 
   x1 x2 x3 
1  2  a  6 
2  3  b  6 
3  4  c  6 
4  5  d  6 
5  6  e  6 
6  7  f  6 
[1] "Modified Data Frame" 
   x1 x2 x3 ID 
1  2  a  6  1 
2  3  b  6  2 
3  4  c  6  3 
4  5  d  6  4 
5  6  e  6  5 
6  7  f  6  6

Publicación traducida automáticamente

Artículo escrito por codersgram9 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *