En este artículo, discutiremos cómo eliminar varias columnas usando el paquete dplyr en el lenguaje de programación R.
Conjunto de datos en uso:
Suelte varias columnas usando el nombre de la columna
Podemos eliminar una columna con el método select() por su nombre de columna
Sintaxis :
select(dataframe,-c(column_name1,column_name2,.,column_name n)
Donde dataframe es el dataframe de entrada y -c(column_names) es la colección de nombres de la columna que se eliminará.
Ejemplo: programa R para eliminar varias columnas por nombre de columna
R
# load the library library(dplyr) # create dataframe with 3 columns id, # name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith','pinkey', 'dhanush','sravan','gnanesh', 'ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # remove name and id column print(select(data1,-c(id,name))) # remove name and address column print(select(data1,-c(address,name))) # remove all column print(select(data1,-c(address,name,id)))
Producción:
Suelte varias columnas usando el índice de columna
Podemos eliminar una columna con el método select() por su índice/posición de columna. El índice comienza con 1.
Sintaxis:
seleccionar (marco de datos, -c (columna_índice1, columna_índice2,.,columna_índice n)
Donde dataframe es el marco de datos de entrada y c(column_indexes) es la posición de las columnas que se eliminarán.
Ejemplo: programa R para eliminar varias columnas por posición
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith','pinkey', 'dhanush','sravan','gnanesh', 'ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # remove name and id columns by # its position print(select(data1,-c(1,2)))
Producción:
Soltar columna que contiene un valor o coincide con un patrón
Veamos cómo eliminar la columna que contiene el carácter/string.
Método 1: Usar contiene()
Muestra la columna que contiene la substring dada y luego -contains() elimina la columna que contiene la substring dada.
Sintaxis:
seleccionar (marco de datos, – contiene (‘sub_string’))
Aquí, el marco de datos es el marco de datos de entrada y la sub_string es la string presente en el nombre de la columna que se eliminará.
Método 2: Usar coincidencias()
Muestra la columna que contiene la substring dada y luego -matches() elimina la columna que contiene la substring dada
Sintaxis:
seleccionar (marco de datos, -coincide (‘sub_string’))
Aquí, el marco de datos es el marco de datos de entrada y la sub_string es la string presente en el nombre de la columna que se eliminará.
Ejemplo: programa R que elimina la columna usando el método contains()
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith','pinkey', 'dhanush','sravan','gnanesh', 'ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # remove column that contains na print(select(data1,-contains('na'))) # remove column that contains re print(select(data1,-contains('re')))
Producción:
Eliminar columna que comienza o termina con cierto carácter
Aquí también podemos seleccionar columnas en función de los caracteres iniciales y finales.
- «starts_with()» se usa para devolver la columna que comienza con el carácter dado y «starts_with()» se usa para eliminar la columna que comienza con el carácter dado.
Sintaxis:
seleccionar (marco de datos, – comienza_con (‘substring’))
Donde, el marco de datos es el marco de datos de entrada y la substring es el carácter/string que comienza con él
- extremos_con() se usa para devolver la columna que termina con el carácter dado y – extremos_con() se usa para eliminar la columna que termina con el carácter dado.
Sintaxis:
seleccionar (marco de datos, – termina_con (‘substring’))
Donde, marco de datos es el marco de datos de entrada y substring es el carácter/string que termina con él.
Ejemplo 1: programa R para eliminar una columna que comienza con carácter/substring
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith','pinkey', 'dhanush','sravan','gnanesh', 'ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # remove column that starts with na print(select(data1,-starts_with('na'))) # remove column that starts with ad print(select(data1,-starts_with('ad')))
Producción:
Ejemplo 2: programa R para eliminar la columna que termina con carácter/substring
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith','pinkey', 'dhanush','sravan','gnanesh', 'ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # remove column that ends with d print(select(data1,-ends_with('d'))) # remove column that starts with ss print(select(data1,-ends_with('ss')))
Producción:
Suelte el nombre de la columna con la expresión regular
Aquí vamos a soltar la columna según el patrón dado en la función grepl(). Encontrará un patrón y eliminará la columna según el patrón dado
Sintaxis:
marco de datos [,! grepl («patrón», nombres (marco de datos))]
Aquí, el marco de datos es el marco de datos de entrada y el patrón es la expresión para eliminar la columna.
Patrón para eliminar la columna donde comienza el carácter inicial en la columna
Sintaxis:
datos[,!grepl(“^letra”,nombres(datos))]
Ejemplo: programa R para eliminar la columna que comienza con una letra
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith','pinkey', 'dhanush','sravan','gnanesh', 'ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # drop column that starts with n print(data1[,!grepl("^n",names(data1))]) # remove column that starts with a print(data1[,!grepl("^a",names(data1))])
Producción:
Publicación traducida automáticamente
Artículo escrito por gottumukkalabobby y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA