Filtre valores múltiples en una columna de string en R usando Dplyr

En este artículo, aprenderemos cómo filtrar múltiples valores en una columna de string en el lenguaje de programación R usando el paquete dplyr .

Método 1: Usar el método filter()

La función filter() se usa para elegir casos y filtrar los valores según las condiciones de filtrado.

Sintaxis: filtro (df, condición)

Parámetros:

df: objeto de marco de datos

condición: filtrado basado en esta condición

Ejemplo: programa R para filtrar múltiples valores usando filter()

R

library(dplyr)
  
df <- data.frame(prep = c(11:15),
                 str = c("Welcome", "to", "Geeks",
                         "for", "Geeks"),
                 date=c("Sunday","Monday", "Thursday",
                        "January","December"))
  
  
filter(df,date=='Sunday'| date=='Monday')

Producción:

  prep     str   date
1   11 Welcome Sunday
2   12      to Monday

Método 2: usar filter() con el operador %in%

En esto, primero, pase su objeto de marco de datos a la función de filtro, luego, en el parámetro de condición, escriba el nombre de la columna en la que desea filtrar valores múltiples, luego coloque el operador %in% y luego pase un vector que contenga todos los valores de string que quieres en el resultado. Esto produce todas las filas que contienen los valores de string en la columna especificada.

Sintaxis: filter(df, date %in% c(“Jueves”, “Enero”, “Domingo”))

Parámetros:

df: objeto de marco de datos

condición: column_name %in% vector string de valores

Ejemplo: programa R para filtrar múltiples valores usando %in%

R

library(dplyr)
  
df <- data.frame(prep = c(11:15),
                 str = c("Welcome", "to", "Geeks",
                         "for", "Geeks"),
                 date=c("Sunday","Monday", "Thursday",
                        "January","December"))
  
filter(df, date %in%  c("Thursday", "January", "Sunday"))

Producción:

  prep     str     date
1   11 Welcome   Sunday
2   13   Geeks Thursday
3   14     for  January

Ejemplo: Igual que el anterior, pero en este ejemplo, realizamos la misma operación, pero en diferentes columnas con un conjunto diferente de valores. 

R

library(dplyr)
  
df <- data.frame(prep = c(11:15),
                 str = c("Welcome", "to", "Geeks",
                         "for", "Geeks"),
                 date=c("Sunday","Monday", "Thursday", 
                        "January","December"))
  
filter(df, str %in%  c("Geeks", "to"))

Producción:

  prep   str     date
1   12    to   Monday
2   13 Geeks Thursday
3   15 Geeks December

Método 3: Usando el método select()

Para esta funcionalidad, la función select() acepta 2 parámetros, el primero es la función de filtro y el segundo es un vector de nombres de columna,

Sintaxis: select(filtro(df, condición, columnas)

Parámetros:

df : objeto de marco de datos

condición: condición de filtrado

columnas: vector de nombres de columna que desea imprimir

filter() funciona casi de la misma manera que se indicó anteriormente, la única diferencia es el vector de nombres de columna que estamos pasando en el segundo argumento. Esto imprime solo las columnas que se pasaron en la función de selección. De esta manera podemos imprimir solo las columnas seleccionadas.

Ejemplo: Imprimir filas seleccionadas

R

library(dplyr)
  
df <- data.frame(prep = c(11:15),
                 str = c("Welcome", "to", "Geeks", 
                         "for", "Geeks"),
                 date=c("Sunday","Monday", "Thursday",
                        "January","December"))
  
  
select(filter(df, date %in% c("January", "Monday")), c(date,prep))

Producción:

      date prep
1  Monday   12
2 January   14

Publicación traducida automáticamente

Artículo escrito por sudhanshublaze y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *