Comprender el gráfico de ganancia y el gráfico de elevación

El gráfico de ganancia y el gráfico de elevación son dos medidas que se utilizan para medir los beneficios del uso del modelo y se utilizan en contextos comerciales como el marketing objetivo. No se limita sólo al análisis de marketing. También se puede usar en otros dominios, como el modelado de riesgos, el análisis de la string de suministro, etc. En otras palabras, los gráficos de ganancia y elevación son dos enfoques que se utilizan para resolver problemas de clasificación con conjuntos de datos desequilibrados.

Ejemplo : en campañas de marketing o marketing dirigido, las respuestas de los clientes a las campañas suelen ser muy bajas (en muchos casos, los clientes que responden a las campañas de marketing son menos del 1%). La organización aumentará el costo de cada contacto con el cliente y, por lo tanto, le gustaría minimizar el costo de la campaña de marketing y, al mismo tiempo, lograr el nivel de respuesta deseado de los clientes. 

El gráfico de ganancia y el gráfico de elevación son las medidas en regresión logística que ayudarán a las organizaciones a comprender los beneficios de usar ese modelo. De modo que se lleve a cabo una salida mejor y más eficiente.

El gráfico de ganancia y sustentación se obtiene siguiendo los siguientes pasos:

  1. Prediga la probabilidad Y = 1 (positiva) usando el modelo LR y organice la observación en el orden decreciente de la probabilidad predicha [es decir, P(Y = 1)].
  2. Divide los conjuntos de datos en deciles. Calcule el número de positivos (Y = 1) en cada decil y el número acumulado de positivos hasta un decil.
  3. La ganancia es la relación entre el número acumulado de observaciones positivas hasta un decil y el número total de observaciones positivas en los datos. El gráfico de ganancia es un gráfico dibujado entre la ganancia en el eje vertical y el decil en el eje horizontal.

Gain =\frac{\text { Cumulative number of positive observations upto decile} i}{\text { Total number of positive observations in the data }}

4. Elevación es la relación entre el número de observaciones positivas hasta el decil i usando el modelo y el número esperado de observaciones positivas hasta ese decil i basado en un modelo aleatorio. El gráfico de elevación es el gráfico entre la elevación en el eje vertical y el decil correspondiente en el eje horizontal.

Lift =\frac{\text { Cumulative number of positive observations upto decile i using ML model}}{\text { Cumulative number of positive observations upto decile i using random model}}


Cálculo del gráfico de ganancia:

 Relación entre el número acumulado de respuestas positivas hasta un decil y el número total de respuestas positivas en los datos

Gráfico de ganancia:

Cálculo de la tabla de elevación:

Relación entre el número de respuestas positivas hasta el decil i usando el modelo y el número esperado de respuestas positivas hasta ese decil i basado en un modelo aleatorio

Gráfico de elevación:

  • Las ganancias acumuladas y los gráficos de elevación son ayudas visuales para medir el rendimiento del modelo.
  • Ambos gráficos constan de Curva de elevación (Gráfico de elevación) / Gráfico de ganancia (Gráfico de ganancia) y Línea base (Línea azul para elevación, Línea naranja para ganancia).
  • Cuanto mayor sea el área entre la elevación/ganancia y la línea de base, mejor será el modelo.

Publicación traducida automáticamente

Artículo escrito por immortalishika2001 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *