Python | Operaciones matemáticas para el análisis de datos

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Hay algunas operaciones matemáticas importantes que se pueden realizar en una serie de pandas para simplificar el análisis de datos usando Python y ahorrar mucho tiempo.

Para obtener el conjunto de datos utilizado, haga clic aquí

s=read_csv("stock.csv", squeeze=True)
#reading csv file and making series
Función Usar
s.sum() Devuelve la suma de todos los valores de la serie.
s.mean()

Devuelve la media de todos los valores en serie. Igual a s.sum()/s.count() 
 

 

s.std() Devuelve la desviación estándar de todos los valores
s.min() o s.max() Devolver valores mínimos y máximos de la serie
s.idxmin() o s.idxmax() Devuelve el índice del valor mínimo o máximo en serie
s.median() Devuelve la mediana de todos los valores
modo s() Modo de retorno de la serie.
s.value_counts()

Devuelve series con la frecuencia de cada valor. 
 

 

s.describe()

Devuelve una serie con información como media, moda, etc. dependiendo del tipo de datos pasados 
 

 

Código #1: 

Python3

# import pandas for reading csv file
import pandas as pd
 
#reading csv file
s = pd.read_csv("stock.csv", squeeze = True)
 
#using count function
print(s.count())
 
#using sum function
print(s.sum())
 
#using mean function
print(s.mean())
 
#calculation average
print(s.sum()/s.count())
 
#using std function
print(s.std())
 
#using min function
print(s.min())
 
#using max function
print(s.max())
 
#using count function
print(s.median())
 
#using mode function
print(s.mode())

Producción:  

3012
1006942.0
334.3100929614874
334.3100929614874
173.18720477113115
49.95
782.22
283.315
0    291.21

Código #2: 

Python3

# import pandas for reading csv file
import pandas as pd
 
#reading csv file
s = pd.read_csv("stock.csv", squeeze = True)
 
#using describe function
print(s.describe())
 
#using count function
print(s.idxmax())
 
#using idxmin function
print(s.idxmin())
 
#count of elements having value 3
print(s.value_counts().head(3))

Producción: 

dtype: float64
count    3012.000000
mean      334.310093
std       173.187205
min        49.950000
25%       218.045000
50%       283.315000
75%       443.000000
max       782.220000
Name: Stock Price, dtype: float64

3011
11
291.21    5
288.47    3
194.80    3
Name: Stock Price, dtype: int64

Resultados inesperados y restricciones:

  1. .sum(), .mean(), .mode(), .median() y otras operaciones matemáticas similares no se aplican a strings ni a ningún otro tipo de datos que no sean valores numéricos.
  2. .sum() en una serie de strings daría un resultado inesperado y devolvería una string concatenando cada string.

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *