Cómo usar Google Colab

Si desea crear un modelo de aprendizaje automático pero dice que no tiene una computadora que pueda soportar la carga de trabajo, Google Colab es la plataforma para usted. Incluso si tiene una GPU o una buena computadora, crear un entorno local con anaconda e instalar paquetes y resolver problemas de instalación es una molestia. … Continue reading «Cómo usar Google Colab»

ML | Sesgo frente a varianza

En este artículo, aprenderemos ‘Qué son el sesgo y la varianza para un modelo de aprendizaje automático y cuál debería ser su estado óptimo. Hay varias formas de evaluar un modelo de aprendizaje automático. Podemos usar MSE (Mean Squared Error) para la regresión; Precisión, Recall y ROC (Receiver of Characteristics) para un Problema de Clasificación … Continue reading «ML | Sesgo frente a varianza»

Comprender el gráfico de ganancia y el gráfico de elevación

El gráfico de ganancia y el gráfico de elevación son dos medidas que se utilizan para medir los beneficios del uso del modelo y se utilizan en contextos comerciales como el marketing objetivo. No se limita sólo al análisis de marketing. También se puede usar en otros dominios, como el modelado de riesgos, el análisis … Continue reading «Comprender el gráfico de ganancia y el gráfico de elevación»

Prueba de Tukey-Kramer para análisis post hoc

Si en la prueba ANOVA llegamos a la conclusión de que tenemos que rechazar nuestra hipótesis nula (H 0 ) y luego sabemos que las medias de algún tratamiento o nivel de factor son diferentes y deseamos encontrarlas, entonces procedemos a hacer un análisis post hoc con Tukey. prueba para encontrar qué par es diferente. … Continue reading «Prueba de Tukey-Kramer para análisis post hoc»

Diferencia entre ciencia de datos e ingeniería de datos

Data Science: El estudio detallado del flujo de información a partir de los datos presentes en el repositorio de una organización se denomina Data Science. La ciencia de datos se trata de obtener información significativa a partir de datos sin procesar y no estructurados mediante la aplicación de habilidades analíticas, de programación y comerciales.  El … Continue reading «Diferencia entre ciencia de datos e ingeniería de datos»

Moore – Penrose Pseudoinverse en R Programación

El concepto utilizado para generalizar la solución de una ecuación lineal se conoce como Moore – Penrose Pseudoinverse of a matrix. La inversa de Moore-Penrose es el tipo más conocido de array pseudoinversa. En álgebra lineal, la pseudoinversa  de una array A es una generalización de la array inversa. El uso más común de la … Continue reading «Moore – Penrose Pseudoinverse en R Programación»

Python para ciencia de datos

Python es un lenguaje de código abierto, interpretado, de alto nivel y proporciona un gran enfoque para la programación orientada a objetos. Es uno de los mejores lenguajes utilizados por los científicos de datos para varios proyectos/aplicaciones de ciencia de datos. Python proporciona una gran funcionalidad para hacer frente a las matemáticas, las estadísticas y … Continue reading «Python para ciencia de datos»

Optimización univariante: ciencia de datos

Wikipedia define la optimización como un problema en el que maximizas o minimizas una función real eligiendo sistemáticamente valores de entrada de un conjunto permitido y calculando el valor de la función. Eso significa que cuando hablamos de optimización siempre estamos interesados ​​en encontrar la mejor solución. Entonces, digamos que uno tiene alguna forma funcional … Continue reading «Optimización univariante: ciencia de datos»

Las 8 principales fuentes gratuitas de conjuntos de datos para usar en proyectos de ciencia de datos

¿Pensabas que los datos son solo para que las grandes empresas y corporaciones analicen y obtengan información comercial? No, ¡los datos también son divertidos! No hay nada más interesante que analizar un conjunto de datos para encontrar las correlaciones entre los datos y obtener información única. ¡Es casi como un juego de misterio donde los … Continue reading «Las 8 principales fuentes gratuitas de conjuntos de datos para usar en proyectos de ciencia de datos»

¿Qué es la visualización de datos y por qué es importante?

Antes de saltar al término «Visualización de datos», analicemos brevemente el término «Ciencia de datos» porque estos dos términos están interrelacionados. ¿Pero cómo? Entendamos. Entonces, en términos simples, » La ciencia de datos es la ciencia de analizar datos sin procesar utilizando estadísticas y técnicas de aprendizaje automático con el propósito de sacar conclusiones sobre … Continue reading «¿Qué es la visualización de datos y por qué es importante?»