R – Diagrama de Pareto

El gráfico de Pareto es una combinación de un gráfico de barras y un gráfico de líneas que se utiliza para la visualización.
En los diagramas de Pareto, el eje vertical derecho se usa para la frecuencia acumulada, mientras que el eje vertical izquierdo representa la frecuencia. Básicamente utilizan el principio de Pareto que dice que el 80% de los efectos se producen a partir del 20% de las causas de los sistemas.

Aquí tenemos un gráfico de barras que indica la frecuencia de ocurrencia del evento en diferentes categorías en orden decreciente (de izquierda a derecha), y un gráfico de líneas superpuesto indica el porcentaje acumulado de ocurrencias.

Sintaxis:
pareto.chart(x, ylab = “Frecuencia”, ylab2 = “Porcentaje acumulativo”, xlab, cumperc = seq(0, 100, by = 25), ylim, main, col = calor.colores(longitud(x) ))

Parámetros:
x: un vector de valores. Los nombres (x) se utilizan para etiquetar las barras.
ylab: una string que especifica la etiqueta para el eje y.
ylab2: una string que especifica la etiqueta para el segundo eje y en el lado derecho.
xlab: una string que especifica la etiqueta para el eje x.
cumperc: un vector de valores porcentuales que se usará como marcas para el segundo eje y en el lado derecho.
ylim: un vector numérico que especifica los límites para el eje y.
main: una string que especifica el título principal que aparecerá en la trama.
col: un valor para el color, un vector de colores o una paleta para las barras. Ver la ayuda para colores y paleta.

Gráfico de Pareto

Los siguientes son los pasos necesarios para trazar el diagrama de Pareto:

  • Se toma un vector (defecto <- c(Valores…)) que contiene los valores de conteos de diferentes categorías.
  • Se toma un vector (nombres(defecto) <- c(Valores…)) que contiene los valores de string que especifican
    nombres de diferentes categorías.
  • Este «defecto» del vector se grafica usando pareto.chart().

Ejemplo 1:

# x axis numbers
defect <- c(27, 789, 9, 65, 12, 109, 30, 15, 45, 621)
  
# x axis titles
names(defect) <- c("Too noisy", "Overpriced", "Food not fresh", 
                   "Food is tasteless", "Unfriendly staff",
                   "Wait time", "Not clean", "Food is too salty", 
                   "No atmosphere", "Small portions") 
  
pareto.chart(defect, xlab = "Categories", # x-axis label
                     ylab="Frequency",  # label y left
  
# colors of the chart             
col=heat.colors(length(defect)), 
  
# ranges of the percentages at the right
cumperc = seq(0, 100, by = 20),  
  
# label y right
ylab2 = "Cumulative Percentage", 
  
# title of the chart
main = "Complaints of different customers" 
)

Producción :

En el gráfico aquí, la línea naranja de Pareto indica que (789 + 621) / 1722, que es aproximadamente el 80 % de las quejas provienen de 2 de 10 = 20 % de los tipos de quejas (Porciones pequeñas y demasiado caras).

Ejemplo 2:

# x axis numbers
defect <- c(7000, 4000, 5200, 3000, 800)
  
# x axis titles
names(defect) <- c("Class A", "Class B", "Class C",
                   "Class D", "Class E") 
  
pareto.chart(defect, xlab = "Categories",
                     ylab="Frequency",
             col=heat.colors(length(defect)),
             cumperc = seq(0, 100, by = 10),
             ylab2 = "Cumulative Percentage",
             main = "Defects"
)

Producción:

Publicación traducida automáticamente

Artículo escrito por devanshigupta1304 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *