Python | Pandas Series.cov() para encontrar la covarianza

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Pandas Series.cov() se usa para encontrar la covarianza de dos series. En el siguiente ejemplo, la covarianza se encuentra usando el método Pandas y manualmente y luego se comparan las respuestas.

Para obtener más información sobre la covarianza, haga clic aquí.

Sintaxis: Series.cov(otro, min_periods=Ninguno)
Parámetros: 
other: Otras series que se usarán para encontrar la covarianza 
min_periods: Número mínimo de observaciones que se tomarán para tener un resultado válido
Tipo de devolución: Valor flotante, Devuelve la covarianza de la serie de llamadas y serie pasada 

Ejemplo:
en este ejemplo, se crean dos listas y se convierten en series utilizando el método Pandas .Series(). El promedio si se encuentran ambas series y se crea una función para encontrar la covarianza manualmente. Pandas .cov() también se aplica y los resultados de ambas formas se almacenan en variables y se imprimen para comparar los resultados.

Python3

import pandas as pd
 
# list  1
a = [2, 3, 2.7, 3.2, 4.1]
 
# list 2
b = [10, 14, 12, 15, 20]
 
# storing average of a
av_a = sum(a)/len(a)
 
# storing average of b
av_b = sum(b)/len(b)
 
# making series from list a
a = pd.Series(a)
 
# making series from list b
b = pd.Series(b)
    
# covariance through pandas method
covar = a.cov(b)
 
 
# finding covariance manually
def covarfn(a, b, av_a, av_b):
    cov = 0
 
    for i in range(0, len(a)):
        cov += (a[i] - av_a) * (b[i] - av_b)
    return (cov / (len(a)-1))
 
# calling function
cov = covarfn(a, b, av_a, av_b)
 
# printing results
print("Results from Pandas method: ", covar)
print("Results from manual function method: ", cov)

Producción: 

Como se puede ver en la salida, la salida de ambas formas es la misma. Por lo tanto, este método es útil para encontrar la covarianza de series grandes.

Results from Pandas method:  2.8499999999999996
Results from manual function method:  2.8499999999999996

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *