¿Cómo seleccionar columnas específicas en el marco de datos R?

En este artículo, discutiremos cómo seleccionar columnas específicas del marco de datos en el lenguaje de programación R.

Método 1: Seleccionar columnas específicas usando Base R por nombre de columna

En este enfoque para seleccionar una columna específica, el usuario debe escribir el nombre de la columna entre corchetes con el nombre del marco de datos dado según el requisito para obtener las columnas específicas que necesita el usuario.

Sintaxis:

data_frame

Ejemplo:

R

# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9),
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3),
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7),
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific Columns Using Base
# R by column name
gfg[c('b', 'd', 'e')]

Producción:

Método 2: Selección de columnas específicas usando Base R por índice de columna

En este enfoque para seleccionar las columnas específicas, el usuario debe usar los corchetes con el marco de datos dado, y. Con él, el usuario también necesita usar el índice de columnas dentro del corchete donde la indexación comienza con 1, y según los requisitos del usuario, debe proporcionar el índice de columna requerido dentro de los corchetes. 

Sintaxis:

data_frame

Ejemplo :

R

# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9), 
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3),
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7), 
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific Columns Using Base R 
# by column index
gfg[c(2, 4, 5)]

Producción:

Método 3: Seleccionar columnas específicas subdividiendo datos por nombre de columna

En este método de selección de columnas específicas mediante subconjuntos de datos, el usuario debe especificar un vector de caracteres que contenga los nombres de las columnas para extraer, el usuario debe ingresar el vector de los caracteres que corresponde al nombre de la columna en el cuadro. soporte con el marco de datos 

Sintaxis:

data_frame[,c(column_name_1,column_name_2,...)]

Ejemplo:

R

# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9),
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3),
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7), 
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific columns by subsetting 
# data by column name
gfg[, c('b', 'd', 'e')]

Producción:

Método 4: Seleccionar columnas específicas subdividiendo datos por índice de columna

En este método de selección de columnas específicas mediante subconjuntos de datos, el usuario debe especificar un vector entero que contenga el índice de las columnas para extraer, el usuario debe ingresar el vector de los índices que corresponde al índice de la columna en el cuadrado soporte con el marco de datos

Sintaxis:

data_frame[,c(column_index_1,column_index_2,...)]

Ejemplo:

R

# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9),
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3), 
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7), 
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific columns by subsetting data
# by column index:
gfg[, c(2, 4, 5)]

Producción:

Método 5: Selección de columnas específicas mediante la creación de subconjuntos de datos con el argumento seleccionado de la función de subconjunto:

Función de subconjunto: esta función devolverá los subconjuntos de tramas de datos que cumplen las condiciones.

Sintaxis:

subconjunto(x, subconjunto, seleccionar, soltar = FALSO, …)

Parámetros:

  • x: objeto a subdividir.
  • subconjunto: expresión lógica que indica elementos o filas a conservar: los valores faltantes se toman como falsos.
  • select: expresión, que indica columnas para seleccionar de un marco de datos.
  • soltar: pasado a [operador de indexación.
  • …: más argumentos para ser pasados ​​ao desde otros métodos.

Ejemplo:

R

# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9), 
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3), 
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7), 
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific columns by Subsetting 
# Data with select Argument of subset Function
subset(gfg, select=c('b', 'd', 'e'))

Producción:

Método 6: Seleccionar columnas específicas usando el paquete dplyr por nombre de columna

En este enfoque para seleccionar las columnas específicas del marco de datos dado, el usuario primero debe instalar e importar el paquete dplyr en la consola R de trabajo del usuario y luego llamar a la función de selección y pasar el nombre de las columnas requeridas como el argumento de esta función

Sintaxis:

data_frame %>% select(column_name_1,column_name_2,...)   

Ejemplo:

R

# Importing dplyr library
library("dplyr")
  
# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9),
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3),
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7),
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific columns using dplyr 
# package by column name
gfg % > % select(b, d, e)

Producción:

Método 7: Seleccionar columnas específicas usando el paquete dplyr por índice de columna

En este enfoque para seleccionar las columnas específicas del marco de datos dado, el usuario primero debe instalar e importar el paquete dplyr en la consola R de trabajo del usuario y luego llamar a la función de selección y pasar el índice de las columnas requeridas como el argumento de esta función

Sintaxis:

data_frame %>% select(column_index_1,column_index_2,...)  

Ejemplo:

R

# Importing dplyr library
library("dplyr")
  
# Creating DataFrame
gfg < - data.frame(a=c(5, 1, 1, 5, 6, 7, 5, 4, 7, 9), 
                   b=c(1, 8, 6, 8, 6, 7, 4, 1, 7, 3), 
                   c=c(7, 1, 8, 9, 4, 1, 5, 6, 3, 7),
                   d=c(4, 6, 8, 4, 6, 4, 8, 9, 8, 7), 
                   e=c(3, 1, 6, 4, 8, 9, 7, 8, 9, 4))
  
# Selecting specific columns using dplyr 
# package by column index
gfg % > % select(2, 4, 5)

Producción:

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *