Seleccionar subconjunto de columnas de DataTable en R

En este artículo, discutiremos cómo seleccionar un subconjunto de columnas de tablas de datos en el lenguaje de programación R.

Vamos a crear una tabla de datos usando una array. Primero, necesitamos cargar el paquete data.table en el espacio de trabajo.

Instalación

install.packages(“data.table”)                         

Cargando

biblioteca («tabla de datos») 

Conjunto de datos en uso:

Método 1: Usando []

Podemos seleccionar un subconjunto de columnas de tabla de datos por operador de índice – []

Sintaxis:

datatable[ , c(columnas), con = FALSO]

Dónde,

  • datatable es la tabla de datos de entrada
  • las columnas son las columnas en la tabla de datos que se seleccionarán
  • con =FALSO es un parámetro opcional

Ejemplo: programa R para seleccionar un subconjunto de columnas de la tabla de datos

R

# load data.table package
library("data.table")
  
# create data table with matrix with 20 elements
# 4 rows and 5 columns
data= data.table(matrix(1:20, nrow=4,ncol = 5))             
  
# display the subset that include v1 and v3 columns
print(data[ ,  c("V1", "V3"), with = FALSE])
  
# display the subset that include v1 , v2 and v3 columns
print(data[ ,  c("V1","V2", "V3"), with = FALSE])
  
# display the subset that include v2,v3,v4 and v5 columns
print(data[ ,  c("V2", "V3","V4","V5"), with = FALSE])

Producción:

Método 2: Usando !

Usando ! El operador antes de las columnas puede ser suficiente para hacer el trabajo con este enfoque. Aquí no estamos incluyendo el subconjunto que se selecciona de la tabla de datos

Sintaxis:

datatable[ , !c(columnas), con = FALSO]

dónde,

  • datatable es la tabla de datos de entrada
  • las columnas son las columnas en la tabla de datos que se seleccionarán

Ejemplo: programa R para seleccionar columnas de la tabla de datos

R

# load data.table package
library("data.table")
  
# create data table with matrix with 20 elements
# 4 rows and 5 columns
data= data.table(matrix(1:20, nrow=4,ncol = 5))             
  
# display the subset that exclude v1 and v3 columns
print(data[ ,  !c("V1", "V3"), with = FALSE])
  
# display the subset that exclude  v1 , v2 and v3 columns
print(data[ ,  !c("V1","V2", "V3"), with = FALSE])
  
# display the subset that exclude v2,v3,v4 and v5 columns
print(data[ ,  !c("V2", "V3","V4","V5"), with = FALSE])

Producción:

Publicación traducida automáticamente

Artículo escrito por gottumukkalabobby y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *