Introducción
El análisis del conjunto de datos de llamadas de emergencia y el descubrimiento de tendencias y patrones ocultos ayudarán a garantizar que el equipo de respuesta a emergencias esté mejor equipado para hacer frente a las emergencias.
Teniendo en cuenta los accidentes de tráfico, incendios, etc., un número elevado en áreas específicas indica que existe una gran demanda de servicios de ambulancia en esas áreas. Los accidentes de tráfico en algunas zonas pueden deberse a las condiciones de las carreteras que deben mejorarse. La alta frecuencia de emergencias debido a problemas respiratorios puede deberse a contaminantes nocivos en el aire en esa área específica. La minería de reglas de asociación ayudará, por lo tanto, a descubrir dichos patrones.
Sistema propuesto
Preprocesamiento del conjunto de datos —> Minería de reglas de asociación —> Extracción de patrones interesantes de las reglas obtenidas —> Validación de las reglas
Conjunto de datos utilizado
El conjunto de datos para el análisis se obtuvo de Kaggle. El conjunto de datos contiene llamadas de emergencia al 911 en el condado de Montgomery ubicado en la Mancomunidad de Pensilvania. Los atributos elegidos incluyen: tipo de emergencia, sello de tiempo, municipio donde ocurrió la emergencia.
Preprocesamiento
Se eliminan las filas con valores faltantes. Los valores numéricos deben convertirse a categóricos para la minería de reglas de asociación. Por lo tanto, la marca de tiempo se convierte en día de la semana, mes y hora del día (mañana, tarde, noche, noche).
Minería
de reglas de asociación El aprendizaje de reglas de asociación es un método de aprendizaje automático basado en reglas para descubrir relaciones interesantes entre variables en grandes bases de datos. Su objetivo es identificar reglas sólidas descubiertas en bases de datos utilizando algunas medidas de interés (Apoyo, Confianza).
Elección de un umbral adecuado para el soporte y la confianza:
establezca un soporte mínimo más alto para una base de datos muy pequeña y más bajo para bases de datos muy grandes. Si establece un soporte mínimo más alto para una base de datos pequeña, es para asegurarse de que los conjuntos de elementos sean significativos. Si establece un soporte mínimo más bajo para bases de datos grandes, es para garantizar que se encuentren suficientes conjuntos de elementos.
Ascensor: Si una regla tuviera un ascensor de 1, implicaría que la probabilidad de ocurrencia del antecedente y la del consecuente son independientes entre sí. Cuando dos eventos son independientes entre sí, no se puede establecer ninguna regla que involucre a esos dos eventos. Si la elevación es > 1, eso nos permite saber el grado en que esas dos ocurrencias dependen una de la otra y hace que esas reglas sean potencialmente útiles para predecir el consecuente en conjuntos de datos futuros. Si una regla tiene mayor confianza y menor elevación, intuitivamente parecería que es más valiosa debido a su mayor confianza: parece más precisa (mejor respaldada). Pero la precisión de la regla puede ser engañosa. El valor de lift es que considera tanto la confianza de la regla como el conjunto de datos general.
Resultados y Validación de Reglas Obtenidas
Conjunto 1:
{Tarde,Diciembre} => {Tráfico: ACCIDENTE VEHICULAR}
{Diciembre,Noche} => {Tráfico: ACCIDENTE VEHICULAR}
{Diciembre,Mañana} => {Tráfico: ACCIDENTE VEHICULAR}
{Diciembre } => {Tráfico: ACCIDENTE DE VEHÍCULO}
Estas reglas indican que es probable que ocurran muchos accidentes en diciembre.
En invierno (diciembre-enero-febrero), las temperaturas son de 44 °F (7 °C) y 28 °F (?2 °C). Durante los inviernos, debido a las capas de hielo en puntos de todo el condado, la cantidad de accidentes de vehículos es alta. Según la Administración Nacional de Seguridad del Tráfico en las Carreteras (NHTSA), durante el período navideño, ocurren muchas muertes que involucran a un conductor bajo los efectos del alcohol. Todos estos accidentes serían ciertamente menores si se generalizara el uso de alcoholímetros.
Conjunto 2:
{EMS: VÍCTIMA DE AGRESIÓN, Noche} => {NORRISTOWN}
{EMS: VÍCTIMA DE AGRESIÓN, Tarde} => {NORRISTOWN}
{EMS: VÍCTIMA DE AGRESIÓN, POTTSTOWN} => {Noche}
Estas reglas indican que Norristown, Pottstown puede no ser seguro por las noches y por las tardes.
Según los informes, aunque las tasas generales de delincuencia han disminuido lenta y constantemente durante más de una década, lo que refleja una tendencia nacional, Norristown se mantiene obstinadamente por delante de los municipios vecinos del condado de Montgomery en delitos violentos. Las razones de esto pueden ser: una población más densa y menos próspera; el flagelo de las drogas; los desafíos presentados por la demografía que cambia rápidamente.
Conjunto 3:
{EMS: SOBREDOSIS,MENU MERION} => {Noche}
{CHELTENHAM,EMS: SOBREDOSIS} => {Noche}
{EMS: SOBREDOSIS,Domingo} => {Noche}
{EMS: SOBREDOSIS,Sábado} => { Noche}
{EMS: SOBREDOSIS,Viernes} => {Noche}
{EMS: SOBREDOSIS,NORRISTOWN} => {Noche}
{EMS: SOBREDOSIS,POTTSTOWN} => {Noche}
Estas reglas indican que la sobredosis de drogas puede ser alta durante los fines de semana por la noche, probablemente porque es más probable que las personas estén de fiesta y tomen drogas en ese momento. Otra razón para la sobredosis de drogas, cuando un médico deja de recetar opioides o esos medicamentos se vuelven demasiado caros, un paciente puede cambiar a la heroína, que es relativamente barata y fácil de obtener. La heroína (droga) es un opioide, una sustancia que reduce la intensidad de las señales de dolor en el cuerpo.
Las reglas indican que Lower Merion, Cheltenham, Norristown, Pottstown (pueblos en Pensilvania) reciben un número significativo de llamadas de emergencia por sobredosis de drogas.
La tasa de mortalidad por sobredosis de drogas en todo el estado de Pensilvania en 2015 fue de 26 por cada 100 000 personas, un aumento con respecto a la tasa informada de 2014 de 21 por cada 100 000 personas. Según los CDC, la tasa nacional de mortalidad por sobredosis de drogas en 2014 (más reciente disponible) fue de 14,7 por cada 100.000 personas. Según los informes, las sobredosis aumentaron drásticamente en el condado de Montgomery durante el último año. El condado vive la peor epidemia de sobredosis de su historia, según información proporcionada por la Fiscalía.
Conjunto 4:
{EMS: CVA/STROKE} => {Mañana}
La regla indica que es probable que ocurra un derrame cerebral por la mañana.
La investigación científica dice que es más probable que sufra un derrame cerebral temprano en la mañana que en cualquier otro momento, y este mayor riesgo está relacionado con los ritmos naturales del cuerpo.
Ritmos circadianos (El ritmo circadiano, presente en los humanos y la mayoría de los otros animales, es generado por un reloj interno que está sincronizado con los ciclos de luz y oscuridad y otras señales en el entorno de un organismo.) parecen desempeñar un papel en la presión arterial, temperatura corporal, y otras funciones corporales. Durante las primeras horas de la mañana, cuando la presión arterial es más alta, el riesgo de accidente cerebrovascular parece aumentar.
Conjunto 5:
{EMS: FIEBRE} => {Noche}
{EMS: FIEBRE} => {Mañana}
{EMS: FIEBRE} => {Tarde}
La primera regla tiene mayor confianza que las otras dos.
La razón de este patrón en las reglas puede deberse a esto: la temperatura corporal generalmente sigue un ciclo incorporado de 24 horas. Su punto más bajo es entre las 3 y las 6 am, seguido de un pico entre las 4 y las 11 pm
Dos factores principales regulan este ciclo:
El hipotálamo tiene su propio patrón de secreción de hormonas de 24 horas.
Las cosas que hace el cuerpo durante el día (latidos del corazón, movimientos musculares, respiración) implican una liberación de energía térmica, lo que hace que la temperatura corporal central se caliente a medida que avanza el día.
Esto explica por qué su temperatura aumenta hacia el final del día en condiciones normales. Sin embargo, este ciclo aún ocurre cuando tienes fiebre. La diferencia es que ahora, la elevación de la temperatura es más obvia ya que estás comenzando desde una temperatura más alta de lo normal.
Serie 6:
{ABINGTON,EMS: AGOTAMIENTO DE CALOR,Noche} => {Agosto}
{EMS: AGOTAMIENTO DE CALOR,Noche,Jueves} => {Agosto}
{Tarde,EMS: AGOTAMIENTO DE CALOR,Lunes} => {Julio}
{EMS : AGOTAMIENTO DE CALOR, Tarde, Lunes} => {Junio}
{ABINGTON, EMS: AGOTAMIENTO DE CALOR} => {Agosto}
Las reglas indican que el agotamiento por calor es alto en Abington en los meses de agosto, junio durante el día.
Las temperaturas se disparan durante el día en verano (junio, julio, agosto) y provocan agotamiento por calor. Educar a las personas para que practiquen medidas de seguridad contra el calor (no pasen demasiado tiempo bajo el sol, hagan trabajos al aire libre temprano en la mañana o al final de la tarde, usen ropa liviana, de colores claros y holgada, tomen descansos frecuentes a la sombra, manténganse bien hidratados .) ayudará a reducir estas emergencias.
Herramientas utilizadas
R y RStudio
• Se requiere un paquete de reglas para la minería de reglas de asociación.
• El paquete arulesViz es útil para visualizar los resultados.
Aplicación
Este proyecto es útil para el equipo de respuesta a emergencias de cada país.
Este artículo es una contribución de Brinda. m _ Si le gusta GeeksforGeeks y le gustaría contribuir, también puede escribir un artículo usando contribuya.geeksforgeeks.org o envíe su artículo por correo a contribuya@geeksforgeeks.org. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks.
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA