¿Cómo calcular la correlación parcial en R?

En este artículo, discutiremos cómo calcular la correlación parcial en el lenguaje de programación R.

La Correlación Parcial ayuda a medir el grado de asociación entre dos variables aleatorias cuando existe el efecto de otras variables que las controlan. Básicamente da una relación precisa entre dos variables aleatorias con el efecto de otras variables que también las afectan. 

Para calcular la correlación parcial en el lenguaje R, usamos la función pcor() de la biblioteca del paquete ppcor. La biblioteca del paquete ppcor nos ayuda a calcular correlaciones parciales y semiparciales junto con el valor p. La función pcor() nos ayuda a calcular las correlaciones parciales por pares para cada par de variables dadas otras. También nos da el valor p y la estadística para cada par de variables. 

Para usar la función pcor(), primero debemos instalar la biblioteca de paquetes ppcor. Para instalar la biblioteca ppcor, usamos

install.packages("ppcor")

Después de la instalación, podemos cargar la biblioteca ppcor usando la función library(). Y luego use la siguiente sintaxis para calcular la correlación parcial en el lenguaje R.

Sintaxis:

PCOR( df )

Parámetro:

  • df: determina el marco de datos cuya correlación parcial se va a calcular.

Ejemplo: Ejemplo básico de correlación parcial con dos columnas del marco de datos.

R

# create sample data frame
sample_data <- data.frame( x= c(1,2,3,4,5,6,7,7,7,8),
                           y= c(4,5,6,7,8,9,9,9,10,10))
  
# load library ppcor
library(ppcor)
  
# calculate Partial Correlation
pcor( sample_data )

Producción:

$estimate
         x         y
x 1.0000000 0.9854592
y 0.9854592 1.0000000
$p.value
            x            y
x 0.000000e+00 1.921901e-07
y 1.921901e-07 0.000000e+00
$statistic
        x        y
x  0.00000 16.40436
y 16.40436  0.00000
$n
[1] 10
$gp
[1] 0
$method
[1] "pearson"

Aquí, el valor de correlación parcial entre xey es 0,9854592, lo que significa que xey son muy consistentes y aumentan entre sí.

Ejemplo: Ejemplo básico de correlación parcial con tres columnas del marco de datos.

R

# create sample data frame
sample_data <- data.frame( x= c(1,2,3,4,5,6,7,7,7,8),
                           y= c(4,5,6,7,8,9,9,9,10,10),
                           z= c(1,3,5,7,9,11,13,15,17,19))
  
# load library ppcor
library(ppcor)
  
# calculate Partial Correlation
pcor( sample_data )

Producción:

$estimate
         x          y          z
x 1.0000000 0.76314445 0.58810321
y 0.7631444 1.00000000 0.05552034
z 0.5881032 0.05552034 1.00000000
$p.value
          x          y          z
x 0.00000000 0.01673975 0.09578687
y 0.01673975 0.00000000 0.88718502
z 0.09578687 0.88718502 0.00000000
$statistic
        x         y         z
x 0.000000 3.1244245 1.9238403
y 3.124425 0.0000000 0.1471199
z 1.923840 0.1471199 0.0000000
$n
[1] 10
$gp
[1] 1
$method
[1] "pearson"

Aquí, el valor de correlación parcial entre xey se cambia del ejemplo anterior cuando el vector xey sigue siendo el mismo porque el vector z los está afectando. Así que ahora el valor de correlación cayó a 0,76314445 desde 0,9854592 porque x y z son inconsistentes con el valor de 0,58810321.

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *