En este artículo, analizaremos cómo seleccionar filas con una coincidencia de string parcial en el lenguaje de programación R.
Método 1: Usar el paquete stringr
El paquete stringr en lenguaje R se utiliza principalmente para la manipulación de caracteres, operaciones sensibles a la configuración regional, alteración de espacios en blanco y coincidencia de patrones. Aquí usaremos su funcionalidad de coincidencia de patrones para filtrar datos de acuerdo con la coincidencia de strings parciales.
Sintaxis:
df[str_detect(df$nombre-columna, “Patrón”), ]
Parámetros:
- df: determina el marco de datos que se está utilizando.
- column-name: determina la columna en la que se deben filtrar las strings.
- Patrón: determina el patrón de string que debe coincidir.
Ejemplo: este ejemplo explica cómo extraer filas con una coincidencia parcial usando el paquete stringr.
R
# Load library stringr library("stringr") # sample dataframe data<- data.frame(names=c('Hello','this','Hell','Geeks', 'Geek', 'Geeksforgeeks')) # Filter data with str_detect for strings # containing "Gee" result1<-data[str_detect(data$name, "Gee"), ] # print result data result1 # Filter data with str_detect for strings # containing "Hel" result2<-data[str_detect(data$name, "Hel"), ] # print result data result2
Producción:
[1] «Geeks» «Geek» «Geeksforgeeks»
[1] “Hola” “Diablos”
Método 2: Usar el paquete data.table
Data.table es una extensión del paquete data.frame en R. Es ampliamente utilizado para la agregación rápida de grandes conjuntos de datos, agregar/actualizar/eliminar columnas de baja latencia, uniones ordenadas más rápidas y un lector de archivos rápido. Aquí usaremos su actualización de datos de la funcionalidad de la columna para filtrar datos de acuerdo con la coincidencia de string parcial. Usaremos el operador %like% para seleccionar los datos de coincidencia de string y filtraremos los datos del marco de datos en consecuencia.
Sintaxis:
df[df$nombre-columna %like% “Patrón”, ]
Parámetro:
- df: determina el marco de datos que se está utilizando.
- column-name: determina la columna en la que se deben filtrar las strings.
- Patrón: determina el patrón de string que debe coincidir.
Ejemplo: este ejemplo explica cómo extraer filas con una coincidencia parcial utilizando el paquete data.table.
R
# load data.table package library("data.table") # sample dataframe data<- data.frame(names=c('Hello','this','Hell','Geeks', 'Geek', 'Geeksforgeeks')) # Filter data with %like% all strings having "Gee" result1<-data[data$name %like% "Gee", ] # print result data result1 # Filter data with %like% all strings having "Hel" result2<-data[data$name %like% "Hel", ] # print result data result2
Producción:
[1] «Geeks» «Geek» «Geeksforgeeks»
[1] “Hola” “Diablos”
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA