En este artículo, discutiremos cómo normalizar los datos en el lenguaje de programación R.
La normalización de datos es el enfoque para escalar los datos en un rango fijo, generalmente de 0 a 1, de modo que reduzca la escala de las variables.
Método 1: normalizar datos con transformación de registro en base R
En este enfoque para normalizar los datos con su transformación de registro, el usuario debe llamar a log(), que es una función incorporada, y pasar el marco de datos como su parámetro para transformar los datos dados en su registro y los datos resultantes se transformarán. a la escala
La función log() se usa para calcular logaritmos, por defecto logaritmo natural.
Sintaxis:
registro (x)
Parámetros:
- x: un vector numérico o complejo.
Ejemplo: normalizar datos
R
# Create data gfg < - c(244, 753, 596, 645, 874, 141, 639, 465, 999, 654) # normalizing data gfg < -log(gfg) gfg
Producción:
[1] 5,497168 6,624065 6,390241 6,469250 6,773080 4,948760 6,459904 6,142037 6,906755 6,483107
Método 2: normalizar datos con escala estándar en R
En este método para normalizar los datos, el usuario simplemente necesita llamar a la función scale(), que es una función incorporada, y pasar los datos que se necesitan para escalar, y además esto resultará en datos normalizados del rango -1 a 1 en el lenguaje de programación R.
Scale() es una función genérica cuyo método predeterminado centra y/o escala las columnas de una array numérica.
Sintaxis:
escala(x)
Parámetros:
- x: Datos
Ejemplo: normalizar datos
R
# Create data gfg <- c(244,753,596,645,874,141,639,465,999,654) # normalizing data gfg <- as.data.frame(scale(gfg)) gfg
Producción:
V1 1 -1.36039519 2 0.57921588 3 -0.01905315 4 0.16766775 5 1.04030220 6 -1.75289016 7 0.14480397 8 -0.51824578 9 1.51663105 10 0.20196343
Método 3: normalice los datos usando el escalado mínimo-máximo
En este método para normalizar, el usuario primero debe instalar e importar el paquete intercalado en la consola de trabajo de R, y luego el usuario debe llamar a la función preProcess() con el método pasado como el rango como sus parámetros, y luego el usuario llama a la función predict() para obtener los datos finales de normalización que llevarán a la normalización de los datos dados a la escala de 0 a 1 en el lenguaje de programación R.
La función perProcess() se utiliza para que la transformación se pueda estimar a partir de los datos de entrenamiento y aplicarse a cualquier conjunto de datos con las mismas variables.
Sintaxis:
preProceso(x,método)
Parámetros:
- x: Datos
- método: un vector de caracteres que especifica el tipo de procesamiento.
Ejemplo: normalizar datos
R
library(caret) # Create data gfg <- c(244,753,596,645,874,141,639,465,999,654) # normalizing data ss <- preProcess(as.data.frame(gfg), method=c("range")) gfg <- predict(ss, as.data.frame(gfg)) gfg
Producción:
gfg 1 0.1200466 2 0.7132867 3 0.5303030 4 0.5874126 5 0.8543124 6 0.0000000 7 0.5804196 8 0.3776224 9 1.0000000 10 0.5979021
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA