¿Cómo normalizar datos en R?

En este artículo, discutiremos cómo normalizar los datos en el lenguaje de programación R.

La normalización de datos es el enfoque para escalar los datos en un rango fijo, generalmente de 0 a 1, de modo que reduzca la escala de las variables.

Método 1: normalizar datos con transformación de registro en base R

En este enfoque para normalizar los datos con su transformación de registro, el usuario debe llamar a log(), que es una función incorporada, y pasar el marco de datos como su parámetro para transformar los datos dados en su registro y los datos resultantes se transformarán. a la escala

La función log() se usa para calcular logaritmos, por defecto logaritmo natural.

Sintaxis:

registro (x)

Parámetros:

  • x: un vector numérico o complejo.

Ejemplo: normalizar datos 

R

# Create data
gfg < - c(244, 753, 596, 645, 874, 141,
          639, 465, 999, 654)
  
# normalizing data
gfg < -log(gfg)
gfg

Producción:

  [1] 5,497168 6,624065 6,390241 6,469250 6,773080 4,948760 6,459904 6,142037 6,906755 6,483107

Método 2: normalizar datos con escala estándar en R

En este método para normalizar los datos, el usuario simplemente necesita llamar a la función scale(), que es una función incorporada, y pasar los datos que se necesitan para escalar, y además esto resultará en datos normalizados del rango -1 a 1 en el lenguaje de programación R.

Scale() es una función genérica cuyo método predeterminado centra y/o escala las columnas de una array numérica.

Sintaxis:

escala(x)

Parámetros:

  • x: Datos

Ejemplo: normalizar datos

R

# Create data
gfg <- c(244,753,596,645,874,141,639,465,999,654)
  
# normalizing data
gfg <- as.data.frame(scale(gfg)) 
gfg

Producción:

            V1
1  -1.36039519
2   0.57921588
3  -0.01905315
4   0.16766775
5   1.04030220
6  -1.75289016
7   0.14480397
8  -0.51824578
9   1.51663105
10  0.20196343

Método 3: normalice los datos usando el escalado mínimo-máximo

En este método para normalizar, el usuario primero debe instalar e importar el paquete intercalado en la consola de trabajo de R, y luego el usuario debe llamar a la función preProcess() con el método pasado como el rango como sus parámetros, y luego el usuario llama a la función predict() para obtener los datos finales de normalización que llevarán a la normalización de los datos dados a la escala de 0 a 1 en el lenguaje de programación R.

La función perProcess() se utiliza para que la transformación se pueda estimar a partir de los datos de entrenamiento y aplicarse a cualquier conjunto de datos con las mismas variables.

Sintaxis:

preProceso(x,método)

Parámetros:

  • x: Datos
  • método: un vector de caracteres que especifica el tipo de procesamiento.

Ejemplo: normalizar datos

R

library(caret)
  
# Create data
gfg <- c(244,753,596,645,874,141,639,465,999,654)
  
# normalizing data
ss <- preProcess(as.data.frame(gfg), method=c("range"))
  
gfg <- predict(ss, as.data.frame(gfg))
gfg

Producción:

         gfg
1  0.1200466
2  0.7132867
3  0.5303030
4  0.5874126
5  0.8543124
6  0.0000000
7  0.5804196
8  0.3776224
9  1.0000000
10 0.5979021

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *