El método para identificar grupos de datos similares en un conjunto de datos se denomina agrupación. Las entidades de cada grupo son comparativamente más similares a las entidades de ese grupo que a las de los otros grupos.
STING (algoritmo de agrupación en cuadrícula de información estadística) y OPTICS (punto de pedido para identificar el algoritmo de agrupación en agrupación de la estructura de agrupación) son algoritmos de agrupación utilizados en el aprendizaje no supervisado. Son técnicas de aprendizaje automático que se utilizan para agrupar los puntos de datos de entrada dados en grupos o grupos en función de sus atributos. STING es un algoritmo de agrupamiento basado en cuadrículas, mientras que OPTICS es un algoritmo de agrupamiento basado en densidad. Agrupación
Estas son algunas diferencias entre STING y OPTICS .
S. No. | PICADURA | ÓPTICA |
---|---|---|
1. | STING es la abreviatura de Red de información estadística | OPTICS es la abreviatura de Punto de pedido para identificar la estructura de agrupamiento |
2. | Es un algoritmo de agrupamiento basado en grib | Es un algoritmo de agrupamiento basado en la densidad. |
3. | No se trata de puntos de datos sino del espacio de valores que rodea los puntos de datos. | Busca en el espacio de datos áreas de puntos de datos de densidad variada en el espacio de datos. |
4. | Utiliza una estructura de datos de cuadrícula multidimensional que cuantifica el espacio en un número finito de celdas. | Es una extensión del agrupamiento espacial basado en la densidad de aplicaciones con ruido. |
5. |
Las siguientes son las propiedades del algoritmo de agrupamiento STING:
|
Las siguientes son las propiedades del algoritmo de agrupamiento OPTICS:
|
6. | Tiene una complejidad computacional relativamente menor. | Tiene relativamente más complejidad computacional. |
Algoritmo STING:
- Determinar una capa, para empezar.
- Para cada celda de esta capa, calculamos el intervalo de confianza (o rango estimado) de probabilidad de que esta celda sea relevante para la consulta.
- A partir del cálculo del intervalo anterior, etiquetamos la celda como relevante o no relevante.
- Si esta es la capa inferior, termine el proceso.
- Bajamos un nivel en la estructura jerárquica. Vaya al Paso 2 para aquellos niveles que forman las celdas relevantes de la capa de nivel superior.
Diagrama de jerarquía de STING:
Algoritmo ÓPTICO:
La distancia al núcleo de un punto P es la distancia más pequeña tal que la vecindad de P tenga al menos minPts puntos.
La distancia de accesibilidad de p desde q1 es la distancia del núcleo ( ε’ ).
La distancia de accesibilidad de p desde q2 es la distancia euclidiana entre p y q2.
Publicación traducida automáticamente
Artículo escrito por ShivamKumar1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA