La normalización es una etapa de preprocesamiento de cualquier tipo de enunciado del problema. En particular, la normalización tiene un papel importante en el campo de la computación suave, la computación en la nube, etc. para la manipulación de datos, la reducción o la ampliación del rango de datos antes de que se utilicen para etapas posteriores. Hay tantas técnicas de normalización allí, a saber, normalización Min-Max, normalización de puntuación Z y normalización de escala decimal.
La normalización consiste en escalar los datos que se van a analizar a un rango específico como [0.0, 1.0] para proporcionar mejores resultados.
¿Qué es la normalización de datos?
Las operaciones de transformación de datos, como la normalización y la agregación, son procedimientos adicionales de preprocesamiento de datos que contribuirían al éxito del proceso de extracción de datos.
La normalización de datos generalmente se considera el desarrollo de datos limpios. Sin embargo, profundizando más, el significado o el objetivo de la normalización de datos es doble:
- La normalización de datos es la organización de los datos para que parezcan similares en todos los registros y campos.
- Aumenta la cohesión de los tipos de entrada, lo que lleva a la limpieza, generación de clientes potenciales, segmentación y datos de mayor calidad.
Importancia de la normalización de datos
La Normalización de Datos dispone de diversas anomalías que pueden complicar el examen de la información. Una parte de esas irregularidades puede manifestarse al borrar información, incorporar más datos o actualizar datos existentes. Una vez que esos errores se resuelven y eliminan del marco, se pueden adquirir más ventajas a través de diferentes trabajos en los datos y el examen de datos.
Es en su mayor parte a través de la normalización de datos que los datos dentro de un conjunto de datos pueden diseñarse para que puedan visualizarse y examinarse.
Ventajas de la normalización de datos
Necesidad de Normalización
los atributos a
La normalización es una técnica de escalado o una técnica de mapeo o una etapa de preprocesamiento. Donde podemos encontrar una nueva gama a partir de una ya existente. Puede ser muy útil para fines de predicción o pronóstico. Como sabemos, hay muchas formas de predecir o pronosticar, pero todas pueden variar mucho entre sí. Entonces, para mantener la gran variedad de predicciones y pronósticos, se requieren técnicas de normalización para acercarlos. Hay algunas técnicas de normalización existentes como se menciona a continuación:
un son
Donde A son los datos del atributo,
Min(A), Max(A) son los valores absolutos mínimo y máximo de A respectivamente.
v’ es el nuevo valor de cada entrada en datos.
v es el valor antiguo de cada entrada en datos.
new_max(A), new_min(A) son los valores máximo y mínimo del rango (es decir, el valor límite del rango requerido) respectivamente.
escala : la v i , v i ‘
donde j es el entero más pequeño tal que max(|v i ‘|)<1.
Normalización de puntuación Z o normalización de media cero :
A
Publicación traducida automáticamente
Artículo escrito por varshachoudhary y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA