En este artículo, vamos a seleccionar variables o columnas en el lenguaje de programación R utilizando la biblioteca dplyr.
Conjunto de datos en uso:
Seleccionar columna con nombre de columna
Aquí usaremos el método select() para seleccionar la columna por su nombre
Sintaxis:
seleccionar (marco de datos, columna 1, columna 2,., columna n)
Aquí, el marco de datos es el marco de datos de entrada y las columnas son las columnas en el marco de datos que se mostrarán
Ejemplo 1: programa R para seleccionar columnas
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush', 'sravan','gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada', 'guntur','hyd','tenali','hyd')) # select id column from the dataframe by # column name print(select(data1,id)) # select name column from the dataframe by # column name print(select(data1,name))
Producción:
Ejemplo 2 : programa R para seleccionar varias columnas
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush', 'sravan','gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada', 'guntur','hyd','tenali','hyd')) # select multiple columns from the dataframe # by column name print(select(data1,id,name,address))
Producción:
Seleccionar columna(s) por posición
También podemos usar la posición de la columna y obtener la columna usando el método select(). La posición comienza con 1.
Sintaxis:
seleccionar (marco de datos, posición_columna1, posición_columna2,.,posición_columna n)
donde, el marco de datos es el marco de datos de entrada y la posición de la columna es un número de columna
Para seleccionar varias columnas, podemos usar el operador de rango “;” para seleccionar columnas por su posición
Sintaxis:
seleccionar (marco de datos, posición_inicial:posición_final)
donde, marco de datos es el marco de datos de entrada, posición_inicial es una posición inicial de número de columna y posición_final es una posición final de número de columna
Ejemplo 1: Programa R para seleccionar columna particular por posición de columna
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush', 'sravan','gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada', 'guntur','hyd','tenali','hyd')) # select first column by column position print(select(data1,1)) # select third column by column position print(select(data1,3))
Producción:
Ejemplo 2: programa R para seleccionar múltiples columnas por posiciones
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select multiple column by column position print(select(data1,1,2))
Producción:
Ejemplo 3: programa R para seleccionar múltiples columnas por posición con operador de rango
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select multiple column by column # position with : operator print(select(data1,1:3))
Producción:
Seleccione la columna que contiene un valor o coincide con un patrón
Aquí, mostraremos los valores de la columna según los valores o el patrón presente en la columna.
Método 1: Usar contiene()
Mostrar la columna que contiene la substring dada
Sintaxis:
seleccionar (marco de datos, contiene (‘sub_string’))
Aquí, dataframe es el dataframe de entrada y sub_string es la string presente en el nombre de la columna
Ejemplo: programa R para seleccionar la columna según la substring
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select column that contains am print(select(data1,contains('am'))) # select column that contains d print(select(data1,contains('d'))) # select column that contains dd print(select(data1,contains('dd')))
Producción:
Método 2: Usar coincidencias()
Verificará y mostrará la columna que contiene la substring dada
seleccionar (marco de datos, coincidencias (‘sub_string’))
Aquí, dataframe es el dataframe de entrada y sub_string es la string presente en el nombre de la columna
Ejemplo: programa R para seleccionar la columna según la substring
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select column that matches with am print(select(data1,matches('am'))) # select column that matches with d print(select(data1,matches ('d'))) # select column that matches with dd print(select(data1,matches ('dd')))
Producción:
Seleccione la columna que comienza o termina con cierto carácter
Aquí también podemos seleccionar columnas en función de los caracteres iniciales y finales.
- begin_with() se usa para devolver la columna que comienza con el carácter dado.
Sintaxis:
seleccionar (marco de datos, comienza_con (‘substring’))
Donde, el marco de datos es el marco de datos de entrada y la substring es el carácter/string que comienza con él
- extremos_con() se utiliza para devolver la columna que termina con el carácter dado.
Sintaxis:
select(marco de datos, termina_con(‘substring’))
donde, marco de datos es el marco de datos de entrada y substring es el carácter/string que termina con él
Ejemplo 1: programa R para mostrar columnas que comienzan con un carácter/substring
R
# load the library library(dplyr) # create dataframe with 3 columns id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select column that starts with n print(select(data1,starts_with('n'))) # select column that starts with add print(select(data1,starts_with('add')))
Producción:
Ejemplo 2: programa R para seleccionar la columna que termina con una string o carácter dado
R
# load the library library(dplyr) # create dataframe with 3 columns id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali','vijayawada', 'vijayawada','guntur','hyd','tenali','hyd')) # select column that ends with ss print(select(data1,ends_with('ss'))) # select column that ends with d print(select(data1,ends_with('d')))
Producción:
Seleccionar todas las columnas
Podemos seleccionar todas las columnas en el marco de datos usando el método everything().
Sintaxis :
seleccionar (marco de datos, todo())
Ejemplo : programa R para seleccionar todas las columnas
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select all columns using everything method print(select(data1,everything()))
Producción:
Publicación traducida automáticamente
Artículo escrito por gottumukkalabobby y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA