Prueba U de Mann Whitney en Programación R

Una prueba popular no paramétrica (sin distribución) para comparar resultados entre dos grupos independientes es la prueba U de Mann Whitney . Cuando se comparan dos muestras independientes, cuando el resultado no tiene una distribución normal y las muestras son pequeñas, es adecuada una prueba no paramétrica. Se utiliza para ver la diferencia de distribución … Continue reading «Prueba U de Mann Whitney en Programación R»

Clasificadores de árboles de decisión en programación R

La clasificación es la tarea en la que los objetos de varias categorías se clasifican en sus respectivas clases utilizando las propiedades de las clases. Un modelo de clasificación se utiliza típicamente para, Predecir la etiqueta de clase para un nuevo objeto de datos sin etiqueta Proporcione un modelo descriptivo que explique qué características caracterizan … Continue reading «Clasificadores de árboles de decisión en programación R»

El enfoque del conjunto de validación en la programación R

El enfoque del conjunto de validación es una técnica de validación cruzada en el aprendizaje automático . Las técnicas de validación cruzada se utilizan a menudo para juzgar el rendimiento y la precisión de un modelo de aprendizaje automático. En el enfoque del conjunto de validación, el conjunto de datos que se utilizará para construir … Continue reading «El enfoque del conjunto de validación en la programación R»

Análisis exploratorio de datos en programación R

El análisis exploratorio de datos o EDA es un enfoque o técnica estadística para analizar conjuntos de datos con el fin de resumir sus características importantes y principales, generalmente mediante el uso de algunas ayudas visuales. El enfoque EDA se puede utilizar para recopilar conocimientos sobre los siguientes aspectos de los datos: Principales características o … Continue reading «Análisis exploratorio de datos en programación R»

Funciones de Poisson en programación R – Part 1

La distribución de Poisson representa la probabilidad de que ocurra un número determinado de casos en un período determinado de espacio o tiempo si estos casos ocurren con una tasa media constante identificada (libre del período desde el último evento). La distribución de Poisson lleva el nombre de Siméon Denis Poisson (matemático francés). Muchas distribuciones de … Continue reading «Funciones de Poisson en programación R – Part 1»

Regresión de red elástica en programación R

La regresión de Elastic Net es un algoritmo de clasificación que supera las limitaciones del método lazo (operador de selección y contracción mínima absoluta) que utiliza una función de penalización en su regularización L1. La regresión de Elastic Net es un enfoque híbrido que combina las penalizaciones de la regularización L2 y L1 de los … Continue reading «Regresión de red elástica en programación R»

Regresión de cuantiles en programación R

La regresión cuantil es un algoritmo que estudia el impacto de las variables independientes en diferentes cuantiles de la distribución de la variable dependiente. La regresión de cuantiles proporciona una imagen completa de la relación entre Z e Y. Es robusta y eficaz para los valores atípicos en las observaciones de Z. En la regresión … Continue reading «Regresión de cuantiles en programación R»

Agrupación jerárquica en programación R

El agrupamiento jerárquico en el lenguaje de programación R es un algoritmo no lineal no supervisado en el que se crean grupos de manera que tengan una jerarquía (o un orden predeterminado). Por ejemplo, considere una familia de hasta tres generaciones. Un abuelo y una madre tienen a sus hijos que se convierten en padre … Continue reading «Agrupación jerárquica en programación R»

Cómo extraer la intersección de un modelo de regresión lineal en R

La regresión lineal es un método de análisis predictivo en el aprendizaje automático. Básicamente se utiliza para comprobar dos cosas: Si un conjunto de variables predictoras (independientes) hace un buen trabajo al predecir la variable de resultado (dependiente). Cuáles de las variables predictoras son significativas en términos de predecir la variable de resultado y de … Continue reading «Cómo extraer la intersección de un modelo de regresión lineal en R»

Ingeniería de características en la programación R

La ingeniería de características es la técnica más importante utilizada en la creación de modelos de aprendizaje automático. La ingeniería de características es un término básico que se usa para cubrir muchas operaciones que se realizan en las variables (características) para encajarlas en el algoritmo. Ayuda a aumentar la precisión del modelo, por lo que … Continue reading «Ingeniería de características en la programación R»