Complejidad del modelo KNN

KNN es un algoritmo de aprendizaje automático que se usa tanto para problemas de clasificación (usando KNearestClassifier) ​​como de regresión (usando KNearestRegressor). En el algoritmo KNN, K es el hiperparámetro . Elegir el valor correcto de K importa. Se dice que un modelo de aprendizaje automático tiene una complejidad de modelo alta si el modelo … Continue reading «Complejidad del modelo KNN»

ML | Clustering de K-Medoids con ejemplo resuelto

El algoritmo K-Medoids (también llamado partición alrededor de Medoid) fue propuesto en 1987 por Kaufman y Rousseeuw. Un medoid se puede definir como el punto en el grupo, cuyas diferencias con todos los demás puntos en el grupo es mínima. La disimilitud de medoid(Ci) y object(Pi) se calcula usandoE = |Pi – Ci| El costo … Continue reading «ML | Clustering de K-Medoids con ejemplo resuelto»

ML | Trampa de inicialización aleatoria en K-Means

La trampa de inicialización aleatoria es un problema que ocurre en el algoritmo K-means. En la trampa de inicialización aleatoria, cuando el usuario define explícitamente los centroides de los conglomerados que se van a generar, se pueden crear incoherencias y, en ocasiones, esto puede generar la generación de conglomerados incorrectos en el conjunto de datos. … Continue reading «ML | Trampa de inicialización aleatoria en K-Means»

Cálculo de la puntuación de integridad usando sklearn en Python

Una agrupación completamente completa es aquella en la que cada agrupación tiene información que dirige un lugar hacia una agrupación de clase similar. La integridad representa la cercanía del algoritmo de agrupamiento a esta perfección (completeness_score).  Esta métrica es autónoma de los valores absolutos de las etiquetas. Una permutación de los valores de la etiqueta … Continue reading «Cálculo de la puntuación de integridad usando sklearn en Python»

Los 7 algoritmos de agrupamiento principales que los científicos de datos deben conocer

El agrupamiento se relaciona principalmente con el proceso de agrupar puntos de datos en función de varias similitudes o diferencias entre ellos. Se usa ampliamente en Machine Learning y Data Science y, a menudo, se considera como un tipo de método de aprendizaje no supervisado. Posteriormente, existen varios algoritmos de agrupamiento estándar que se utilizan … Continue reading «Los 7 algoritmos de agrupamiento principales que los científicos de datos deben conocer»