Seleccionar filas con coincidencia de string parcial en R DataFrame

En este artículo, analizaremos cómo seleccionar filas con una coincidencia de string parcial en el lenguaje de programación R.

Método 1: Usar el paquete stringr

El paquete stringr en lenguaje R se utiliza principalmente para la manipulación de caracteres, operaciones sensibles a la configuración regional, alteración de espacios en blanco y coincidencia de patrones. Aquí usaremos su funcionalidad de coincidencia de patrones para filtrar datos de acuerdo con la coincidencia de strings parciales.

Sintaxis:

df[str_detect(df$nombre-columna, “Patrón”), ]

Parámetros:

  • df: determina el marco de datos que se está utilizando.
  • column-name: determina la columna en la que se deben filtrar las strings.
  • Patrón: determina el patrón de string que debe coincidir.

Ejemplo: este ejemplo explica cómo extraer filas con una coincidencia parcial usando el paquete stringr. 

R

# Load library stringr
library("stringr")
 
# sample dataframe
data<- data.frame(names=c('Hello','this','Hell','Geeks',
                          'Geek', 'Geeksforgeeks'))                 
 
# Filter data with str_detect for strings
# containing "Gee"
result1<-data[str_detect(data$name, "Gee"), ]
 
# print result data
result1
 
# Filter data with str_detect for strings
# containing "Hel"
result2<-data[str_detect(data$name, "Hel"), ]
 
# print result data
result2

Producción: 

[1] «Geeks» «Geek» «Geeksforgeeks»

[1] “Hola” “Diablos” 

Método 2: Usar el paquete data.table

Data.table es una extensión del paquete data.frame en R. Es ampliamente utilizado para la agregación rápida de grandes conjuntos de datos, agregar/actualizar/eliminar columnas de baja latencia, uniones ordenadas más rápidas y un lector de archivos rápido. Aquí usaremos su actualización de datos de la funcionalidad de la columna para filtrar datos de acuerdo con la coincidencia de string parcial. Usaremos el operador %like% para seleccionar los datos de coincidencia de string y filtraremos los datos del marco de datos en consecuencia. 

Sintaxis:

df[df$nombre-columna %like% “Patrón”, ]

Parámetro:

  • df: determina el marco de datos que se está utilizando.
  • column-name: determina la columna en la que se deben filtrar las strings.
  • Patrón: determina el patrón de string que debe coincidir.

Ejemplo: este ejemplo explica cómo extraer filas con una coincidencia parcial utilizando el paquete data.table.  

R

# load data.table package
library("data.table")  
 
# sample dataframe
data<- data.frame(names=c('Hello','this','Hell','Geeks',
                          'Geek', 'Geeksforgeeks'))
 
# Filter data with %like% all strings having "Gee"
result1<-data[data$name %like% "Gee", ]
 
# print result data
result1
 
# Filter data with %like% all strings having "Hel"
result2<-data[data$name %like% "Hel", ]
 
# print result data
result2

Producción:

[1] «Geeks» «Geek» «Geeksforgeeks»

[1] “Hola” “Diablos” 

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *