Diferencia entre minería de datos y estadísticas

Minería de datos: la minería de datos es el método de analizar grandes sumas de datos en un esfuerzo por descubrir relaciones, diseños e ideas. Estos diseños, de acuerdo con Witten y Eibe, deben ser «significativos en el sentido de que conducen a algunas ventajas, la mayoría de las veces una ventaja financiera». Los datos en la minería de datos también suelen ser cuantitativos, especialmente cuando consideramos el crecimiento exponencial de los datos proporcionados por las redes sociales más tarde, es decir, los grandes datos.

Estadística: la estadística es la ciencia de recopilar, organizar, resumir y analizar datos para sacar conclusiones o responder preguntas. En expansión, las mediciones están alrededor dando un grado de certeza en cualquier conclusión. La práctica o ciencia de recopilar y analizar información numérica en grandes cantidades, particularmente con el fin de recopilar extensiones en su totalidad de aquellas en una prueba representativa.

Data-Mining-Vs-Statistics

A continuación se muestra una tabla de diferencias entre Data Mining y Estadística:

Procesamiento de datos Estadísticas
Los datos utilizados son numéricos o no numéricos. Los datos utilizados son numéricos.
Proceso Inductivo (Generación de hipótesis modernas a partir de datos) Proceso Deductivo (No incluye hacer ningún pronóstico)
La limpieza de datos es una minería de datos drenada. Los datos limpios se utilizan para aplicar la estrategia estadística.
Investigar y ensamblar datos para empezar, construye espectáculos para distinguir patrones y hacer teorías. Da especulaciones para probar utilizando estadísticas.
Razonable para conjuntos de datos expansivos Adecuado para conjuntos de datos más pequeños
Necesita menos interacción con el cliente para aprobar el modelo, por lo que es fácil de automatizar. Necesita la interacción del cliente para aprobar el programa, por lo tanto, es difícil de automatizar.
Es un cálculo que aprende de los datos sin utilizar ninguna regla de programación. Formalización de la relación en los datos en forma de condición matemática.
Las habilidades requeridas para la minería de datos son Clasificación, Agrupación, Red neuronal, Asociación, Estimación, Análisis basado en secuencias. Las habilidades requeridas para Estadísticas son Estadística Descriptiva, Estadística Inferencial
Las aplicaciones son análisis de datos financieros, industria minorista, industria de telecomunicaciones, Las aplicaciones son demografía, ciencia actuarial, bioestadística, control de calidad.

Publicación traducida automáticamente

Artículo escrito por avengerjanus123 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *