Cómo convertirse en analista de datos en 2019: una guía completa

En los tiempos modernos, los datos contienen todas las respuestas, ¡pero lo principal es hacer las preguntas correctas! Y este es el trabajo del analista de datos. De hecho, el Analista de Datos es quien debe convertir los datos en información y la información en insights. Y estas ideas son luego utilizadas por las empresas … Continue reading «Cómo convertirse en analista de datos en 2019: una guía completa»

Introducción a la ciencia de datos

En un mundo de espacio de datos donde las organizaciones manejan petabytes y exabytes de datos, surgió la era de Big Data, la esencia de su almacenamiento también creció. Fue un gran desafío y preocupación para las industrias el almacenamiento de datos hasta 2010. Ahora, cuando marcos como Hadoop y otros resolvieron el problema del … Continue reading «Introducción a la ciencia de datos»

¿Cómo está cambiando la ciencia de datos la industria de la salud?

La industria de la salud es una de las industrias más importantes. Después de todo, la salud es vital para nuestra calidad de vida e incluso para nuestra supervivencia. Y es por eso que la integración de la ciencia de datos y la inteligencia artificial en la industria de la salud es tan importante. Esta … Continue reading «¿Cómo está cambiando la ciencia de datos la industria de la salud?»

XGBoost en programación R

XGBoost es un algoritmo rápido y eficiente y lo utilizan los ganadores de muchas competencias de aprendizaje automático. XG Boost funciona solo con las variables numéricas. XGBoost en R Es una parte de la técnica boosting en la que la selección de la muestra se hace de forma más inteligente para clasificar las observaciones. Hay … Continue reading «XGBoost en programación R»

Algoritmo de Toivonen en análisis de datos

En este artículo, vamos a discutir el algoritmo de Toivonen en el análisis de datos. Algoritmo de Toivonen: Utiliza la volubilidad de una manera diferente al algoritmo de muestreo simple. Este algoritmo, con una memoria principal adecuada, utilizará una pasada sobre una muestra pequeña y una pasada completa sobre los datos. No dará falsos negativos … Continue reading «Algoritmo de Toivonen en análisis de datos»

Herramientas populares para el análisis de datos

El análisis de datos es un aspecto importante de muchas organizaciones hoy en día. El análisis de datos en tiempo real es esencial para el éxito de una organización importante y ayuda a impulsar la toma de decisiones. Este artículo lo ayudará a obtener conocimiento sobre las diversas herramientas de análisis de datos que se … Continue reading «Herramientas populares para el análisis de datos»

Análisis de datos con Python

El análisis de datos es la técnica para recopilar, transformar y organizar datos para hacer predicciones futuras y tomar decisiones informadas basadas en datos. También ayuda a encontrar posibles soluciones para un problema empresarial. Hay seis pasos para el análisis de datos. Están: Preguntar o especificar requisitos de datos Preparar o recopilar datos Limpiar y … Continue reading «Análisis de datos con Python»

Detección de multicolinealidad con VIF – Python

La multicolinealidad ocurre cuando hay dos o más variables independientes en un modelo de regresión múltiple, que tienen una alta correlación entre sí. Cuando algunas características están altamente correlacionadas, es posible que tengamos dificultades para distinguir entre sus efectos individuales sobre la variable dependiente. La multicolinealidad se puede detectar usando varias técnicas, una de las … Continue reading «Detección de multicolinealidad con VIF – Python»

el cuarteto de anscombe

De acuerdo con la definición dada en Wikipedia, el cuarteto de Anscombe comprende cuatro conjuntos de datos que tienen propiedades estadísticas simples casi idénticas, pero que parecen muy diferentes cuando se grafican. Cada conjunto de datos consta de once (x,y) puntos. Fueron construidos en 1973 por el estadístico Francis Anscombe para demostrar tanto la importancia … Continue reading «el cuarteto de anscombe»