Diferencia entre CURE Clustering y DBSCAN Clustering

La agrupación en clústeres es una técnica utilizada en el aprendizaje no supervisado en el que las muestras de datos se agrupan en grupos sobre la base de la similitud en las propiedades inherentes de la muestra de datos. La agrupación en clústeres también se puede definir como una técnica de agrupación de elementos de datos que son similares de alguna manera. Los elementos de datos que pertenecen a los mismos conglomerados son similares entre sí de alguna manera, mientras que los elementos de datos que pertenecen a diferentes conglomerados son diferentes.

CURE (agrupación mediante representantes) y DBSCAN (agrupación espacial basada en la densidad de aplicaciones con ruido) son algoritmos de agrupación utilizados en el aprendizaje no supervisado. CURE es una técnica de agrupación basada en jerarquías y DBSCAN es una técnica de agrupación basada en densidad.

Estas son algunas diferencias entre CURE y DBSCAN:

S. No. Agrupación CURE Agrupación de DBSCAN
1. CURE Clustering significa Agrupación mediante agrupación de representantes. DBSCAN Clustering significa Agrupación espacial basada en la densidad de aplicaciones con agrupación de ruido.
2. Es una técnica de agrupamiento basada en jerarquías. Es una técnica de agrupamiento basada en la densidad.
3. El manejo del ruido en el agrupamiento CURE no es eficiente. El manejo del ruido en el agrupamiento DBSCAN es eficiente.
4. Algoritmo:

  • Extraiga una muestra aleatoria.
  • Partición de la muestra aleatoria.
  • Agrupe parcialmente la partición.
  • Los valores atípicos se identifican y eliminan.
  • Los agrupamientos parciales obtenidos se agrupan en agrupamientos.
  • Etiquete el resultado en el almacenamiento.
Algoritmo:

  • Todos los puntos de muestra de datos se etiquetan como puntos centrales, puntos fronterizos o puntos de ruido.
  • Los puntos de ruido se eliminan.
  • Todos los puntos centrales están conectados y se encuentran debajo de la vecindad de Eps entre sí.
  • Los puntos centrales que están conectados entre sí se agrupan en un grupo separado.
  • Los puntos fronterizos se asignan a cada grupo.
5. Puede encargarse de conjuntos de datos de alta dimensión. No funciona correctamente para conjuntos de datos de alta dimensión.
6. Las densidades variables de los puntos de datos no importan en el algoritmo de agrupamiento CURE. No funciona correctamente cuando los puntos de datos tienen densidades variables

CURA Arquitectura:

Arquitectura DBSCAN:

Eps : Radio del círculo
minPts : Es el mínimo núm. de puntos que deben existir en la vecindad de eps.

Publicación traducida automáticamente

Artículo escrito por ShivamKumar1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *