Gráfico de violín para análisis de datos

Violin Plot es un método para visualizar la distribución de datos numéricos de diferentes variables. Es similar a Box Plot pero con un gráfico rotado en cada lado, que brinda más información sobre la estimación de la densidad en el eje y. La densidad se refleja y se voltea y la forma resultante se rellena, … Continue reading «Gráfico de violín para análisis de datos»

ML | Predicción de precipitaciones mediante regresión lineal

Requisitos previos: regresión lineal Predicción de lluvia es la aplicación de la ciencia y la tecnología para predecir la cantidad de lluvia en una región. Es importante determinar con exactitud las precipitaciones para un uso eficaz de los recursos hídricos, la productividad de los cultivos y la planificación previa de las estructuras hídricas. En este … Continue reading «ML | Predicción de precipitaciones mediante regresión lineal»

Diferencia entre ciencia de datos y minería de datos

Ciencia de datos : la ciencia de datos es un campo o dominio que incluye e implica trabajar con una gran cantidad de datos y los utiliza para construir modelos analíticos predictivos, prescriptivos y prescriptivos. Se trata de excavar, capturar (construir el modelo), analizar (validar el modelo) y utilizar los datos (implementar el mejor modelo). … Continue reading «Diferencia entre ciencia de datos y minería de datos»

10 ideas de proyectos de ciencia de datos para principiantes

La ciencia de datos y sus subcampos pueden desmoralizarlo en la etapa inicial. La razón es que comprender las transiciones en estadísticas, habilidades de programación (como R , Python ) y algoritmos (ya sean supervisados ​​o no supervisados) es difícil de recordar e implementar. ¿Planeas dejar esta batalla sin pelear pensando que solo eres un … Continue reading «10 ideas de proyectos de ciencia de datos para principiantes»

Pruebas de correlación de Pearson en programación R

La correlación es una medida estadística que indica qué tan fuertemente están relacionadas dos variables. También implica la relación entre múltiples variables. Por ejemplo, si uno está interesado en saber si existe una relación entre las alturas de padres e hijos, se puede calcular un coeficiente de correlación para responder a esta pregunta. Generalmente, se … Continue reading «Pruebas de correlación de Pearson en programación R»

Prueba de Shapiro-Wilk en programación R

La prueba de Shapiro-Wilk o prueba de Shapiro es una prueba de normalidad en las estadísticas frecuentistas. La hipótesis nula de la prueba de Shapiro es que la población se distribuye normalmente. Es una de las tres pruebas de normalidad diseñadas para detectar todo tipo de desviación de la normalidad. Si el valor de p … Continue reading «Prueba de Shapiro-Wilk en programación R»

4 pilares clave de la ciencia de datos

En el mundo del espacio de datos, la era de Big Data surgió cuando las organizaciones manejan petabytes y exabytes de datos. Se volvió muy difícil para las industrias el almacenamiento de datos hasta 2010. Ahora, cuando los marcos populares como Hadoop y otros resolvieron el problema del almacenamiento, la atención se centra en el … Continue reading «4 pilares clave de la ciencia de datos»

Python | Genere conjuntos de datos de prueba para el aprendizaje automático

Siempre que pensamos en Machine Learning, lo primero que nos viene a la mente es un conjunto de datos. Si bien hay muchos conjuntos de datos que puede encontrar en sitios web como Kaggle, a veces es útil extraer datos por su cuenta y generar su propio conjunto de datos. Generar su propio conjunto de … Continue reading «Python | Genere conjuntos de datos de prueba para el aprendizaje automático»

Análisis de datos y su tipo

La analítica es el descubrimiento y la comunicación de patrones significativos en los datos. Especialmente valioso en áreas ricas en información registrada, el análisis se basa en la aplicación simultánea de estadísticas, programación de computadoras e investigación operativa para calificar el desempeño. Los análisis a menudo favorecen la visualización de datos para comunicar información.  Las … Continue reading «Análisis de datos y su tipo»

TensorFlow 2.0

TensorFlow, la plataforma de código abierto enormemente popular para desarrollar e integrar IA a gran escala y modelos de aprendizaje profundo, se actualizó recientemente a su nueva forma TensorFlow 2.0. Esto trae un impulso masivo en las funciones en el ecosistema ML originalmente rico en funciones creado por la comunidad TensorFlow. ¿Qué es el código … Continue reading «TensorFlow 2.0»