Visualice la array de correlación usando la función symnum en la programación R

La correlación se refiere a la relación entre dos variables. Se refiere al grado de correlación lineal entre dos variables aleatorias cualesquiera. Esta relación se puede expresar como un rango de valores expresados ​​dentro del intervalo [-1, 1]. El valor -1 indica una relación no lineal (negativa) perfecta, 1 es una relación lineal positiva perfecta y 0 es un intermedio entre la interdependencia lineal ni positiva ni negativa. Sin embargo, un valor de 0 no indica que las variables sean independientes. Las arrays de correlación calculan el grado de relación lineal entre un conjunto de variables aleatorias, teniendo en cuenta un par a la vez.

Propiedades de la array de correlación 

  1. Todos los elementos de la diagonal de la array de correlación deben ser 1 porque la correlación de una variable consigo misma es siempre perfecta, ej. C ii = 1
  2. Debe ser simétrico, por ejemplo, Cij = C ji

Implementación en R

R tiene una función incorporada, symnum() que se puede usar para visualizar fácilmente el grado de corrección entre varias variables. Puede segregar variables altamente correlacionadas con bastante facilidad de otras. Los coeficientes de correlación se sustituyen por símbolos basados ​​en el grado de relación. En R, la función symnum() tiene la siguiente sintaxis:

Sintaxis:

symnum(arr, puntos de corte = c (0.3, 0.6, 0.8, 0.9, 0.95), símbolos = c (» «, «.», «,», «+», «*», «B»))

Parámetro:

 arr = array lógica o numérica

puntos de corte = coeficientes de correlación los puntos de corte, por ejemplo, el coeficiente entre 0,3 y 0,6 se sustituyen por (“.”). Los elementos diagonales se reemplazan por 1.

símbolos = una array de símbolos para denotar valores de coeficientes de correlación con el número de símbolos siempre es 1 mayor que los puntos de corte.

Nota: Los coeficientes de correlación en el arr deben estar entre -1 y 1.

Visualización de array numérica unidimensional:

R

# defining a single dimension array
arr <- c(6, 4, 3, 2, 5, 1, 8, 7)
  
# cut values are determined at an interval of 2
# symbols are specified by sym 
symnum(arr, cut = c(0, 2, 4, 6, 8), 
       sym = c(".", "-", "+", "$"))

Producción:

[1] + - - . + . $ $
attr(,"legend")
[1] 0 '.' 2 '-' 4 '+' 6 '$' 8

Explicación : todos los valores en el rango de 0 a 2, incluido 2, se indican con un “.”, de manera similar, en el rango de 6 a 8 se indican con “$”. Por lo tanto, la salida indica la denominación de los valores de arr en función de los puntos de corte y los símbolos.
 

Visualización del arreglo lógico unidimensional:
El siguiente fragmento de código indica la aplicación de la función symnum() en el arreglo lógico.

R

# the logical condition is a parameter 
# to the symnum function 
# the default values assigned are | symbol 
# for true values and . for false values 
symnum(1:7 %% 2 == 0)

Producción: 

[1] . | . | . | .

Explicación: Los valores de la array se evalúan según la condición de la array % 2 y el resultado correspondiente se evalúa como un símbolo, ya sea «1» basado en VERDADERO y «.» basado en FALSO.

Visualización de arrays de correlación en R

Las arrays de correlación se pueden crear fácilmente con la función cor() .

Sintaxis: cor (x; use = )

Parámetro:  

x: una array numérica o un marco de datos se ocupa de los valores faltantes.

Esta función genera una array de coeficientes de correlación que luego se puede introducir en la función symnum() para centrarse en los valores altamente correlacionados, a partir de los símbolos especificados en el parámetro de array de símbolos de la función. 

R

# R program to illustrate
# Correlation Matrix
  
# a correlation matrix is defined by cor() function
mat <- cor(matrix(rnorm(30), 10, 3));
  
# printing the correlation matrix mat
print("Correlation matrix")
print(mat)
  
# visualising the relation between various elements 
print("Symbolic symnum representation")
symnum(mat, symbols = c("| ", ".", ",", "+", "*", "B"))

Producción: 

[1] "Correlation matrix"
> print (mat)
         [,1]      [,2]      [,3]
[1,] 1.0000000 0.1295918 0.1137502
[2,] 0.1295918 1.0000000 0.2967970
[3,] 0.1137502 0.2967970 1.0000000
> #visualising the relation between various elements
> print ("Symbolic symnum representation")
[1] "Symbolic symnum representation"
> symnum(mat, symbols = c("| ", ".", ",", "+", "*", "B"))
           
[1,] 1      
[2,] |  1  
[3,] |  |  1
attr(,"legend")
[1] 0 '| ' 0.3 '.' 0.6 ',' 0.8 '+' 0.9 '*' 0.95 'B' 1

Explicación: De forma predeterminada, se imprime una array diagonal inferior, donde los valores indican los símbolos que representan el grado de relación.

Hay varios parámetros que se pueden variar en la función symnum() . El siguiente fragmento de código indica el uso de params:

R

# R program to illustrate
# Correlation Matrix
  
# a correlation matrix is defined by cor() function
mat <- cor(matrix(rexp(30, 1), 5, 5));
  
# printing the correlation matrix mat
print("Correlation matrix")
print(mat)
  
# visualising the relation between various 
# elements without diagonal elements
print("Symbolic symnum representation with false diagonal")
symnum(mat, symbols = c("| ", ".", ",", "+", "*", "B"), 
       diag = FALSE)
  
# setting lower = false 
print("COmplete symnum matrix ")
symnum(mat, symbols = c("| ", ".", ",", "+", "*", "B"),
       lower = FALSE)

Producción: 

[1] "Correlation matrix"
> print (mat)
          [,1]        [,2]       [,3]       [,4]        [,5]
[1,]  1.0000000 -0.39983276 -0.5533282 -0.2420029  0.15030025
[2,] -0.3998328  1.00000000  0.2561824 -0.2090551 -0.05073241
[3,] -0.5533282  0.25618240  1.0000000 -0.6360808 -0.90394274
[4,] -0.2420029 -0.20905508 -0.6360808  1.0000000  0.86086867
[5,]  0.1503003 -0.05073241 -0.9039427  0.8608687  1.00000000
> #visualising the relation between various elements
> print ("Symbolic symnum representation with false diagonal")
[1] "Symbolic symnum representation with false diagonal"
> symnum(mat, symbols = c("| ", ".", ",", "+", "*", "B"),diag=FALSE)
             
[1,]          
[2,] .        
[3,] .  |      
[4,] |  |  ,  
[5,] |  |  * +
attr(,"legend")
[1] 0 '| ' 0.3 '.' 0.6 ',' 0.8 '+' 0.9 '*' 0.95 'B' 1
> print ("COmplete symnum matrix ")
[1] "COmplete symnum matrix "
> symnum(mat, symbols = c("| ", ".", ",", "+", "*", "B"),lower=FALSE)
                 
[1,] 1  .  .  |  |
[2,] .  1  |  |  |
[3,] .  |  1  ,  *
[4,] |  |  ,  1  +
[5,] |  |  *  +  1
attr(,"legend")
[1] 0 '| ' 0.3 '.' 0.6 ',' 0.8 '+' 0.9 '*' 0.95 'B' 1

Explicación: diag = FALSE no imprime los valores de los elementos diagonales, es decir, 1, lo que indica una correlación perfecta. INFERIOR = FALSO, nos ayuda a visualizar la array completa en lugar de solo las diagonales inferiores.

Publicación traducida automáticamente

Artículo escrito por yashchuahan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *