¿Por qué la computación en la nube es importante en la ciencia de datos?

Imagine una pequeña empresa que quiere utilizar el análisis de datos para mejorar sus servicios y obtener una ventaja sobre sus competidores. Esta empresa genera algunos datos, pero también accede a datos de fuentes de terceros para obtener información. Pero la pregunta es ¿cómo aprovechar estos datos? ¡Después de todo, esta pequeña empresa no es … Continue reading «¿Por qué la computación en la nube es importante en la ciencia de datos?»

¿Qué es la analítica aumentada en ciencia de datos?

¡Los datos son Dios para las empresas en estos días! De hecho, la mayoría de las empresas, si no todas, utilizan datos para analizar las tendencias actuales del mercado, comprender los requisitos de sus clientes y crear sus futuras estrategias corporativas. Sin embargo, las grandes corporaciones multinacionales definitivamente tienen una ventaja sobre las pequeñas y … Continue reading «¿Qué es la analítica aumentada en ciencia de datos?»

Prueba Z de una proporción en programación R

La prueba Z de una proporción se utiliza para comparar una proporción observada con una teórica cuando solo hay dos categorías. Por ejemplo, tenemos una población de ratones que contiene la mitad de machos y la mitad de hembras (p = 0,5 = 50%). Algunos de estos ratones (n = 160) desarrollaron cáncer espontáneo, incluidos … Continue reading «Prueba Z de una proporción en programación R»

Ciclo de vida de la ciencia de datos

El ciclo de vida de la ciencia de datos gira en torno al uso del aprendizaje automático y diferentes estrategias analíticas para producir conocimientos y predicciones a partir de la información con el fin de adquirir un objetivo empresarial comercial. El método completo incluye una serie de pasos como la limpieza de datos, la preparación, … Continue reading «Ciclo de vida de la ciencia de datos»

Prueba de Levene en programación R

La prueba de Levene evalúa las varianzas determinadasestándarencontrarvariasformadasexamina la hipótesis nula homogeneidad de la varianza la homocedasticidad compara varias homogeneidades prueba de bartlett prueba de levene Prueba de Fligner-Killeen Es muy fácil realizar estas pruebas en programación R. En este artículo vamos a realizar la prueba de Levene en R. Hipótesis estadísticas para la prueba … Continue reading «Prueba de Levene en programación R»

Explorando la distribución de datos | Serie 1

Cada vez que trabajamos en ciencia de datos y aprendizaje automático, nuestro enfoque de manejar los datos y encontrar algo útil se basa en la distribución de los datos. Distribución significa cómo los datos pueden estar presentes en diferentes formas posibles, el porcentaje de datos específicos, identificando los valores atípicos. Entonces, la distribución de datos … Continue reading «Explorando la distribución de datos | Serie 1»

Las 10 mejores bibliotecas para visualización de datos en 2020

Los datos se están convirtiendo en la columna vertebral de nuestra sociedad actual. Las empresas pueden usar datos para predecir las reacciones de sus clientes, el éxito de sus productos y servicios, y las áreas en las que necesitan trabajar. Los datos también se pueden usar para comprender muchos fenómenos sociales y naturales en el … Continue reading «Las 10 mejores bibliotecas para visualización de datos en 2020»

Descripción general de la ciencia de datos

La ciencia de datos es el estudio de los datos. Al igual que las ciencias biológicas son un estudio de la biología, las ciencias físicas son el estudio de las reacciones físicas. Los datos son reales, los datos tienen propiedades reales y necesitamos estudiarlos si vamos a trabajar en ellos. Data Science involucra datos y … Continue reading «Descripción general de la ciencia de datos»

Diferencia entre ciencia de datos y visualización de datos

Ciencia de datos: la ciencia de datos es el estudio de los datos. Implica desarrollar métodos de registro, almacenamiento y análisis de datos para extraer información útil. El objetivo de la ciencia de datos es obtener conocimiento de cualquier tipo de datos, tanto estructurados como no estructurados. La ciencia de datos es un término para … Continue reading «Diferencia entre ciencia de datos y visualización de datos»

Función de criterio de agrupamiento

El examen de grupos aísla la información en grupos (grupos) que son importantes, valiosos o ambos. En caso de que el objetivo sean grupos significativos, en ese momento, los grupos deben capturar la estructura general de los datos. En algunos casos, sea como fuere, la investigación de conglomerados es, por así decirlo, un valioso punto … Continue reading «Función de criterio de agrupamiento»