Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Hay algunas operaciones matemáticas importantes que se pueden realizar en una serie de pandas para simplificar el análisis de datos usando Python y ahorrar mucho tiempo.
Para obtener el conjunto de datos utilizado, haga clic aquí .
s=read_csv("stock.csv", squeeze=True) #reading csv file and making series
Función | Usar |
---|---|
s.sum() | Devuelve la suma de todos los valores de la serie. |
s.mean() |
Devuelve la media de todos los valores en serie. Igual a s.sum()/s.count()
|
s.std() | Devuelve la desviación estándar de todos los valores |
s.min() o s.max() | Devolver valores mínimos y máximos de la serie |
s.idxmin() o s.idxmax() | Devuelve el índice del valor mínimo o máximo en serie |
s.median() | Devuelve la mediana de todos los valores |
modo s() | Modo de retorno de la serie. |
s.value_counts() |
Devuelve series con la frecuencia de cada valor.
|
s.describe() |
Devuelve una serie con información como media, moda, etc. dependiendo del tipo de datos pasados
|
Código #1:
Python3
# import pandas for reading csv file import pandas as pd #reading csv file s = pd.read_csv("stock.csv", squeeze = True) #using count function print(s.count()) #using sum function print(s.sum()) #using mean function print(s.mean()) #calculation average print(s.sum()/s.count()) #using std function print(s.std()) #using min function print(s.min()) #using max function print(s.max()) #using count function print(s.median()) #using mode function print(s.mode())
Producción:
3012 1006942.0 334.3100929614874 334.3100929614874 173.18720477113115 49.95 782.22 283.315 0 291.21
Código #2:
Python3
# import pandas for reading csv file import pandas as pd #reading csv file s = pd.read_csv("stock.csv", squeeze = True) #using describe function print(s.describe()) #using count function print(s.idxmax()) #using idxmin function print(s.idxmin()) #count of elements having value 3 print(s.value_counts().head(3))
Producción:
dtype: float64 count 3012.000000 mean 334.310093 std 173.187205 min 49.950000 25% 218.045000 50% 283.315000 75% 443.000000 max 782.220000 Name: Stock Price, dtype: float64 3011 11 291.21 5 288.47 3 194.80 3 Name: Stock Price, dtype: int64
Resultados inesperados y restricciones:
- .sum(), .mean(), .mode(), .median() y otras operaciones matemáticas similares no se aplican a strings ni a ningún otro tipo de datos que no sean valores numéricos.
- .sum() en una serie de strings daría un resultado inesperado y devolvería una string concatenando cada string.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA