NumPy es una biblioteca de Python utilizada para la computación numérica. Ofrece arrays multidimensionales robustas como un objeto de Python junto con una variedad de funciones matemáticas. En este artículo, repasaremos todas las funciones esenciales de NumPy utilizadas en el análisis descriptivo de una array. Comencemos inicializando una array de muestra para nuestro análisis.
El siguiente código inicializa una array NumPy:
Python3
import numpy as np # sample array arr = np.array([4, 5, 8, 5, 6, 4, 9, 2, 4, 3, 6]) print(arr)
Producción:
[4 5 8 5 6 4 9 2 4 3 6]
Para describir nuestra array NumPy, necesitamos encontrar dos tipos de estadísticas:
- Medidas de tendencia central.
- Medidas de dispersión.
Medidas de tendencia central
Los siguientes métodos se utilizan para encontrar medidas de tendencia central en NumPy:
- mean()- toma una array NumPy como argumento y devuelve la media aritmética de los datos.
np.mean(arr)
- mediana() – toma una array NumPy como argumento y devuelve la mediana de los datos.
np.median(arr)
El siguiente ejemplo ilustra el uso de los métodos mean() y mediana().
Ejemplo:
Python3
import numpy as np arr = np.array([4, 5, 8, 5, 6, 4, 9, 2, 4, 3, 6]) # measures of central tendency mean = np.mean(arr) median = np.median(arr) print("Array =", arr) print("Mean =", mean) print("Median =", median)
Producción:
Array = [4 5 8 5 6 4 9 2 4 3 6] Mean = 5.09090909091 Median = 5.0
Medidas de dispersión
Los siguientes métodos se utilizan para encontrar medidas de dispersión en NumPy:
- amin()- toma una array NumPy como argumento y devuelve el mínimo.
np.amin(arr)
- amax()- toma una array NumPy como argumento y devuelve el máximo.
np.amax(arr)
- ptp(): toma una array NumPy como argumento y devuelve el rango de los datos.
np.ptp(arr)
- var()- toma una array NumPy como argumento y devuelve la varianza de los datos.
np.var(arr)
- std(): toma una array NumPy como argumento y devuelve la variación estándar de los datos.
np.std(arr)
Ejemplo: El siguiente código ilustra los métodos amin(), amax(), ptp(), var() y std().
Python3
import numpy as np arr = np.array([4, 5, 8, 5, 6, 4, 9, 2, 4, 3, 6]) # measures of dispersion min = np.amin(arr) max = np.amax(arr) range = np.ptp(arr) variance = np.var(arr) sd = np.std(arr) print("Array =", arr) print("Measures of Dispersion") print("Minimum =", min) print("Maximum =", max) print("Range =", range) print("Variance =", variance) print("Standard Deviation =", sd)
Producción:
Array = [4 5 8 5 6 4 9 2 4 3 6] Measures of Dispersion Minimum = 2 Maximum = 9 Range = 7 Variance = 3.90082644628 Standard Deviation = 1.9750509984
Ejemplo: ahora podemos combinar los ejemplos mencionados anteriormente para obtener un análisis descriptivo completo de nuestra array.
Python3
import numpy as np arr = np.array([4, 5, 8, 5, 6, 4, 9, 2, 4, 3, 6]) # measures of central tendency mean = np.mean(arr) median = np.median(arr) # measures of dispersion min = np.amin(arr) max = np.amax(arr) range = np.ptp(arr) variance = np.var(arr) sd = np.std(arr) print("Descriptive analysis") print("Array =", arr) print("Measures of Central Tendency") print("Mean =", mean) print("Median =", median) print("Measures of Dispersion") print("Minimum =", min) print("Maximum =", max) print("Range =", range) print("Variance =", variance) print("Standard Deviation =", sd)
Producción:
Descriptive analysis Array = [4 5 8 5 6 4 9 2 4 3 6] Measurements of Central Tendency Mean = 5.09090909091 Median = 5.0 Minimum = 2 Maximum = 9 Range = 7 Variance = 3.90082644628 Standard Deviation = 1.9750509984
Publicación traducida automáticamente
Artículo escrito por sareendivyansh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA