Gráfica de probabilidad normal

La gráfica de probabilidad es una forma de comparar visualmente los datos provenientes de diferentes distribuciones. Estos datos pueden ser conjuntos de datos empíricos o conjuntos de datos teóricos. La gráfica de probabilidad puede ser de dos tipos:

  • Gráfico PP: El gráfico pp (Probabilidad a probabilidad) es la forma de visualizar la comparación de la función de distribución acumulativa
  • entre una, la

Gráfico de probabilidad normal: el gráfico de probabilidad normal es una forma de saber si el conjunto de datos tiene una distribución normal o no. En este gráfico, los datos se representan frente al gráfico de distribución normal teórica de tal manera que, si un conjunto de datos determinado tiene una distribución normal, debería formar una línea recta aproximada. La gráfica de probabilidad normal es un caso de la gráfica de probabilidad (más específicamente, la gráfica QQ). Este gráfico se usa comúnmente en la industria para encontrar la desviación del proceso normal. 

La gráfica de probabilidad normal tiene el siguiente eje.

  • Eje horizontal : medianas estadísticas de orden normal.
  • Eje vertical : valores de respuesta del pedido

La variable de respuesta al pedido se puede calcular como:

N = G\left ( U_i \right )

Donde Ui es la estadística mediana de orden uniforme y G es la función de punto porcentual de la distribución normal. Es la inversa de la función de distribución acumulada. es decir, dada la distribución de probabilidad, queremos la función de distribución acumulativa.

Las medianas de las estadísticas de orden uniforme se pueden aproximar mediante:

U_i  = 1 - U_n , for \, i = 1\\ f_i = \frac{i-0.375}{n+0.365} for \, i = 2, 3, ..., n-1 \\ U_i = (0.5)^{1/n} \\ for \, i=n

Los supuestos subyacentes para un proceso de medición que los datos deben tener siguiendo 

  • Números al azar.
  • De distribuciones fijas.
  • Con ubicación fija
  • Con escala fija.

La gráfica de probabilidad normal se usa para responder las siguientes preguntas:

  • ¿Los datos se distribuyen normalmente?
  • Si no, ¿cuál es la naturaleza de la distribución?

Implementación

En esta implementación, usaremos la biblioteca python de statsmodels y la biblioteca seaborn para visualizar diferentes gráficos. Estas bibliotecas están preinstaladas en colab, pero para un entorno local mediante pip install. 

Python3

# imports 
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.stats as sc
import statsmodels.graphics.gofplots as sm
  
# define distributions
sample_size = 10000 
standard_norm = np.random.normal(size=sample_size)
heavy_tailed_norm = np.random.normal(loc=0, scale=2, size=sample_size)
skewed_norm = sc.skewnorm.rvs(a=5, size=sample_size)
skew_left_norm = sc.skewnorm.rvs(a=-5, size=sample_size)
  
  
# plots for standard distribution
fig, ax = plt.subplots(1, 2, figsize=(12, 7))
sns.histplot(standard_norm,kde=True, color ='blue',ax=ax[0])
sm.ProbPlot(standard_norm).qqplot(line='s', ax=ax[1])
  
# plot for right-tailed distribution
fig, ax = plt.subplots(1, 2, figsize=(12, 7))
sm.ProbPlot(skewed_norm).qqplot(line='s', ax=ax[1]);
sns.histplot(skewed_norm,kde=True, color ='blue',ax=ax[0])
  
# plot for left-tailed distribution
fig, ax = plt.subplots(1, 2, figsize=(12, 7))
sm.ProbPlot(skew_left_norm).qqplot(line='s',color='red', ax=ax[1]);
sns.histplot(skew_left_norm,kde=True, color ='red',ax=ax[0])
  
# plot for heavy tailed distribution
fig, ax = plt.subplots(1, 2, figsize=(12, 7))
sm.ProbPlot(heavy_tailed_norm).qqplot(line='s',color ='green', ax=ax[1]);
sns.histplot(heavy_tailed_norm,kde=True, color ='green',ax=ax[0])
sns.histplot(standard_norm,kde=True, color ='red',ax=ax[0])

normal estándar

sesgado a la derecha

Sesgado a la izquierda

Heavy-tailed (ver valores del eje)

Referencias:

Publicación traducida automáticamente

Artículo escrito por pawangfg y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *