Seleccione variables (columnas) en R usando Dplyr

En este artículo, vamos a seleccionar variables o columnas en el lenguaje de programación R utilizando la biblioteca dplyr.

Conjunto de datos en uso:

Seleccionar columna con nombre de columna

Aquí usaremos el método select() para seleccionar la columna por su nombre

Sintaxis:

seleccionar (marco de datos, columna 1, columna 2,., columna n)

Aquí, el marco de datos es el marco de datos de entrada y las columnas son las columnas en el marco de datos que se mostrarán

Ejemplo 1: programa R para seleccionar columnas

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush',
                        'sravan','gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada',
                           'guntur','hyd','tenali','hyd'))
  
# select id column from the dataframe by 
# column name
print(select(data1,id))
    
# select name column from the dataframe by
# column name
print(select(data1,name))

Producción:

Ejemplo 2 : programa R para seleccionar varias columnas

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush',
                        'sravan','gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada',
                           'guntur','hyd','tenali','hyd'))
  
# select multiple columns from the dataframe
# by column name
print(select(data1,id,name,address))

Producción:

Seleccionar columna(s) por posición

También podemos usar la posición de la columna y obtener la columna usando el método select(). La posición comienza con 1.

Sintaxis:

seleccionar (marco de datos, posición_columna1, posición_columna2,.,posición_columna n)

donde, el marco de datos es el marco de datos de entrada y la posición de la columna es un número de columna

Para seleccionar varias columnas, podemos usar el operador de rango “;” para seleccionar columnas por su posición

Sintaxis:

seleccionar (marco de datos, posición_inicial:posición_final)

donde, marco de datos es el marco de datos de entrada, posición_inicial es una posición inicial de número de columna y posición_final es una posición final de número de columna

Ejemplo 1: Programa R para seleccionar columna particular por posición de columna

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush',
                        'sravan','gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada',
                           'guntur','hyd','tenali','hyd'))
  
# select first column by column position
print(select(data1,1))
  
# select third column by column position
print(select(data1,3))
   

Producción:

Ejemplo 2: programa R para seleccionar múltiples columnas por posiciones

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select multiple column by column position
print(select(data1,1,2))

Producción:

Ejemplo 3: programa R para seleccionar múltiples columnas por posición con operador de rango

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select multiple column by column 
# position with : operator
print(select(data1,1:3))

Producción:

Seleccione la columna que contiene un valor o coincide con un patrón

Aquí, mostraremos los valores de la columna según los valores o el patrón presente en la columna. 

Método 1: Usar contiene() 

Mostrar la columna que contiene la substring dada

Sintaxis:

seleccionar (marco de datos, contiene (‘sub_string’))

Aquí, dataframe es el dataframe de entrada y sub_string es la string presente en el nombre de la columna

Ejemplo: programa R para seleccionar la columna según la substring

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select column that contains am
print(select(data1,contains('am')))
  
# select column that contains d
print(select(data1,contains('d')))
  
# select column that contains dd
print(select(data1,contains('dd')))

Producción:

Método 2: Usar coincidencias()

Verificará y mostrará la columna que contiene la substring dada

seleccionar (marco de datos, coincidencias (‘sub_string’))

Aquí, dataframe es el dataframe de entrada y sub_string es la string presente en el nombre de la columna

Ejemplo: programa R para seleccionar la columna según la substring

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select column that matches with  am
print(select(data1,matches('am')))
  
# select column that matches with d
print(select(data1,matches ('d')))
  
# select column that matches with  dd
print(select(data1,matches ('dd')))

Producción:

Seleccione la columna que comienza o termina con cierto carácter

Aquí también podemos seleccionar columnas en función de los caracteres iniciales y finales.

  • begin_with() se usa para devolver la columna que comienza con el carácter dado.

Sintaxis:

seleccionar (marco de datos, comienza_con (‘substring’))

Donde, el marco de datos es el marco de datos de entrada y la substring es el carácter/string que comienza con él

  • extremos_con() se utiliza para devolver la columna que termina con el carácter dado.

Sintaxis:

select(marco de datos, termina_con(‘substring’))

donde, marco de datos es el marco de datos de entrada y substring es el carácter/string que termina con él

Ejemplo 1: programa R para mostrar columnas que comienzan con un carácter/substring

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select column that starts with n
print(select(data1,starts_with('n')))
  
# select column that starts with add
print(select(data1,starts_with('add')))

Producción:

Ejemplo 2: programa R para seleccionar la columna que termina con una string o carácter dado

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali','vijayawada',
                           'vijayawada','guntur','hyd','tenali','hyd'))
  
# select column that ends with ss
print(select(data1,ends_with('ss')))
  
# select column that ends with d
print(select(data1,ends_with('d')))

Producción:

Seleccionar todas las columnas

Podemos seleccionar todas las columnas en el marco de datos usando el método everything().

Sintaxis :

seleccionar (marco de datos, todo())

Ejemplo : programa R para seleccionar todas las columnas

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select all columns using everything method
print(select(data1,everything()))

Producción:

Publicación traducida automáticamente

Artículo escrito por gottumukkalabobby y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *