DBSCAN significa Agrupación espacial basada en la densidad de aplicaciones con ruido .
Es un método popular de aprendizaje no supervisado utilizado para la construcción de modelos y algoritmos de aprendizaje automático. Es un método de agrupamiento utilizado para separar los clústeres de alta densidad de los clústeres de baja densidad. Divide los puntos de datos en muchos grupos para que los puntos que se encuentran en el mismo grupo tengan las mismas propiedades. Fue propuesto por Martin Ester, Hans-Peter Kriegel, Jorg Sander y Xiaowei Xu en 1996.
DBSCAN está diseñado para usarse con bases de datos que pueden acelerar las consultas regionales. No puede agrupar conjuntos de datos con grandes diferencias en sus densidades.
Características
- Identifica grupos de cualquier forma en un conjunto de datos, lo que significa que puede detectar grupos de forma arbitraria.
- Se basa en nociones intuitivas de clústeres y ruido.
- Es muy robusto en la detección de valores atípicos en el conjunto de datos.
- Requiere solo dos puntos que son muy insensibles al orden de aparición de los puntos en el conjunto de datos.
Ventajas
- No se requiere la especificación del número de grupos de datos en el conjunto de datos.
- Puede encontrar cualquier grupo de forma incluso si el grupo está rodeado por cualquier otro grupo.
- Puede encontrar fácilmente valores atípicos en el conjunto de datos.
- No es muy sensible al ruido, significa que es tolerante al ruido.
- Es el segundo método de agrupamiento más utilizado después de K-means.
Desventajas
- La calidad del resultado depende de la medida de distancia utilizada en la función regionQuery.
- Los puntos fronterizos pueden ir en cualquier grupo según el orden de procesamiento, por lo que no es completamente determinista.
- Puede ser costoso cuando el costo del cálculo del vecino más cercano es alto.
- Puede ser lento en ejecución para dimensiones más altas.
- La adaptabilidad de la variación en la densidad local es menor.
Publicación traducida automáticamente
Artículo escrito por ypsjnv2013 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA