Covarianza y Correlación en Programación R

Covarianza y Correlación son términos usados ​​en estadística para medir las relaciones entre dos variables aleatorias. Ambos términos miden la dependencia lineal entre un par de variables aleatorias o datos bivariados. 

En este artículo, vamos a discutir las funciones cov() , cor() y cov2cor() en R que usan métodos de covarianza y correlación de estadística y teoría de probabilidad.

Covarianza en lenguaje de programación R

En la programación R, la covarianza se puede medir usando la función cov() . La covarianza es un término estadístico utilizado para medir la dirección de la relación lineal entre los vectores de datos. Matemáticamente, 
\operatorname{Cov}(x, y)=\frac{\Sigma\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{N}

dónde, 

x representa el vector de datos x 
y representa el vector de datos y 
   [Tex]\bar{x} [/Tex]representa la media del vector de datos x 
   [Tex]\bar{y} [/Tex]representa la media del vector de datos y 
N representa observaciones totales

Sintaxis de covarianza en R

Sintaxis: cov(x, y, método)

dónde, 

  • x e y representan los vectores de datos
  • method define el tipo de método que se utilizará para calcular la covarianza. El valor predeterminado es «pearson».

Ejemplo: 

R

# Data vectors
x <- c(1, 3, 5, 10)
 
y <- c(2, 4, 6, 20)
 
# Print covariance using different methods
print(cov(x, y))
print(cov(x, y, method = "pearson"))
print(cov(x, y, method = "kendall"))
print(cov(x, y, method = "spearman"))

Producción: 

[1] 30.66667
[1] 30.66667
[1] 12
[1] 1.666667

Correlación en lenguaje de programación R

La función cor() en la programación R mide el valor del coeficiente de correlación. La correlación es un término de relación en estadística que usa el método de covarianza para medir qué tan fuerte están relacionados los vectores. Matemáticamente,
\operatorname{Corr}(x, y)=\frac{\sum\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum\left(x_{i}-\bar{x}\right)^{2} \sum\left(y_{i}-\bar{y}\right)^{2}}}

dónde, 

x representa el vector de datos x 
y representa el vector de datos y 
   [Tex]\bar{x} [/Tex]representa la media del vector de datos x 
   [Tex]\bar{y} [/Tex]representa la media del vector de datos y

Correlación en R

Sintaxis: cor(x, y, método)

dónde, 

  • x e y representan los vectores de datos
  • method define el tipo de método que se utilizará para calcular la covarianza. El valor predeterminado es «pearson».

Ejemplo: 

R

# Data vectors
x <- c(1, 3, 5, 10)
 
y <- c(2, 4, 6, 20)
 
# Print correlation using different methods
print(cor(x, y))
 
print(cor(x, y, method = "pearson"))
print(cor(x, y, method = "kendall"))
print(cor(x, y, method = "spearman"))

Producción: 

[1] 0.9724702
[1] 0.9724702
[1] 1
[1] 1

Conversión de covarianza a correlación en R

La función cov2cor() en la programación R convierte una array de covarianza en la array de correlación correspondiente.

Sintaxis: cov2cor(X)

dónde, 

  • X e y representan la array cuadrada de covarianza

Ejemplo: 

R

# Data vectors
x <- rnorm(2)
y <- rnorm(2)
 
# Binding into square matrix
mat <- cbind(x, y)
 
# Defining X as the covariance matrix
X <- cov(mat)
 
# Print covariance matrix
print(X)
 
# Print correlation matrix of data
# vector
print(cor(mat))
 
# Using function cov2cor()
# To convert covariance matrix to
# correlation matrix
print(cov2cor(X))

Producción: 

           x          y
x  0.0742700 -0.1268199
y -0.1268199  0.2165516

   x  y
x  1 -1
y -1  1

   x  y
x  1 -1
y -1  1

Publicación traducida automáticamente

Artículo escrito por utkarsh_kumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *