Índice de Dunn e índice DB: índices de validez de clúster | Serie 1

Se utilizan diferentes métricas de rendimiento para evaluar diferentes algoritmos de aprendizaje automático. En caso de problemas de clasificación, tenemos una variedad de medidas de rendimiento para evaluar qué tan bueno es nuestro modelo. Para el análisis de conglomerados, la pregunta análoga es cómo evaluar la «bondad» de los conglomerados resultantes. ¿Por qué necesitamos índices de … Continue reading «Índice de Dunn e índice DB: índices de validez de clúster | Serie 1»

PNL | Etiquetador brillante

La clase BrillTagger es un etiquetador basado en transformación . No es una subclase de SequentialBackoffTagger. Además, utiliza una serie de reglas para corregir los resultados de un etiquetador inicial. Estas reglas que sigue se basan en la puntuación. Esta puntuación es igual a la no. de errores que corrigen menos el no. de los … Continue reading «PNL | Etiquetador brillante»

Implementación de regresión lineal ponderada localmente

LOESS o LOWESS son métodos de regresión no paramétricos que combinan múltiples modelos de regresión en un metamodelo basado en el vecino más cercano. LOESS combina gran parte de la simplicidad de la regresión lineal de mínimos cuadrados con la flexibilidad de la regresión no lineal. Lo hace ajustando modelos simples a subconjuntos localizados de … Continue reading «Implementación de regresión lineal ponderada localmente»

Visualización y predicción de datos de producción de cultivos usando Python

Requisito previo: visualización de datos en Python Visualización es ver los datos a lo largo de varias dimensiones. En python, podemos visualizar los datos usando varios gráficos disponibles en diferentes módulos. En este artículo, vamos a visualizar y predecir los datos de producción de cultivos para diferentes años utilizando varias ilustraciones y bibliotecas de Python. … Continue reading «Visualización y predicción de datos de producción de cultivos usando Python»

Algoritmo de complemento Naive Bayes (CNB)

Los algoritmos Naive Bayes son un grupo de algoritmos de aprendizaje automático muy populares y comúnmente utilizados para la clasificación. Hay muchas formas diferentes de implementar el algoritmo Naive Bayes, como Gaussian Naive Bayes, Multinomial Naive Bayes, etc. Para obtener más información sobre los conceptos básicos de Naive Bayes, puede seguir este enlace. Complement Naive … Continue reading «Algoritmo de complemento Naive Bayes (CNB)»

Importación del conjunto de datos de Kaggle en el colaborativo de Google

Al construir un modelo de aprendizaje profundo, la primera tarea es importar conjuntos de datos en línea y esta tarea a veces resulta ser muy agitada. Podemos importar fácilmente conjuntos de datos de Kaggle en solo unos pocos pasos: Código: Importación de conjuntos de datos CIFAR 10 !pip install kaggle Ahora vaya a su cuenta … Continue reading «Importación del conjunto de datos de Kaggle en el colaborativo de Google»

Análisis exploratorio de datos en Python | Serie 1

El análisis exploratorio de datos es una técnica para analizar datos con técnicas visuales y todos los resultados estadísticos. Aprenderemos cómo aplicar estas técnicas antes de aplicar cualquier modelo de aprendizaje automático. Para obtener el enlace al csv archivo utilizado, haga clic aquí . Cargando bibliotecas: import numpy as np import pandas as pd import … Continue reading «Análisis exploratorio de datos en Python | Serie 1»

Comprensión de TF-IDF (frecuencia de término-frecuencia de documento inversa)

TF-IDF son las siglas de Term Frequency Inverse Document Frequency of records. Se puede definir como el cálculo de cuán relevante es una palabra en una serie o corpus para un texto. El significado aumenta proporcionalmente al número de veces que aparece una palabra en el texto, pero se compensa con la frecuencia de palabras … Continue reading «Comprensión de TF-IDF (frecuencia de término-frecuencia de documento inversa)»

Explicación de redes de memoria a largo plazo

Requisitos previos: redes neuronales recurrentes  Para resolver el problema de los gradientes que desaparecen y explotan en una red neuronal recurrente profunda, se desarrollaron muchas variaciones. Uno de los más famosos es la Red de Memoria a Largo Corto Plazo (LSTM). En concepto, una unidad recurrente LSTM trata de “recordar” todo el conocimiento pasado que … Continue reading «Explicación de redes de memoria a largo plazo»

Aprendizaje automático para la detección de anomalías

La Detección de Anomalías es la técnica de identificación de eventos raros u observaciones que pueden generar sospechas por ser estadísticamente diferentes al resto de las observaciones. Tal comportamiento «anómalo» generalmente se traduce en algún tipo de problema como un fraude con tarjeta de crédito, una máquina defectuosa en un servidor, un ataque cibernético, etc. … Continue reading «Aprendizaje automático para la detección de anomalías»