La transversalidad de la Inteligencia Artificial y su capacidad para hacer frente a los problemas desafiantes hizo que las técnicas de IA impregnaran casi todos los sectores de la economía y la sociedad. Su capacidad de emular inteligencia brinda una amplia gama de soluciones, como apoyo a la toma de decisiones, generación de diagnósticos, segmentación de clientes, predicción de situaciones no deseadas y más.
Debido a su prominencia en el sector actual, proporcionar soluciones basadas en IA se considera el trabajo más sexy del siglo. Según Forbes , se espera que el mercado mundial de aprendizaje automático alcance los 20.830 millones de dólares en 2024 . Pero hay una escasez significativa de cerebros brillantes para satisfacer la gran demanda en el sector de la IA. En esta función, analizaremos algunos proyectos de inteligencia artificial (IA) competitivos e interesantes que pueden mejorar sus habilidades de IA.
- Medición de distancias entre entidades médicas: DrugBank
- Hacia un codificador de red neuronal universal para series temporales
- Perfiles de navegación de patrones web para campañas de marketing en línea
- ¿Los mensajes positivos de Twitter tienen un impacto en la liquidez de las acciones?
1. Medición de distancias entre entidades médicas: DrugBank
El procesamiento de datos médicos es un trabajo duro para las industrias de la salud. Se enfrentan a muchas dificultades para medir entidades médicas, como enfermedades, partes del cuerpo, medicamentos, síntomas, etc. Este proyecto basado en IA presenta una solución basada en IA para medir la distancia entre los medicamentos según un nombre similar, una descripción similar, objetivos similares y composiciones químicas similares.
Para identificar la distancia en base a las propiedades anteriores, tenemos que representar las drogas en un modelo de espacio vectorial, y luego debemos analizar la similitud textual, la similitud semántica y la similitud química.
La similitud textual tiene como objetivo determinar el nivel de similitud entre dos textos. Aquí, los campos de texto como descripción, indicación y farmacodinámica se concatenan para realizar el procesamiento del lenguaje natural. El proceso de NLP incluye metodologías como la eliminación de palabras vacías, la transformación a minúsculas y la identificación de la frecuencia inversa del documento (tf-idf) . Luego usamos la indexación semántica latente (LSI) para reducir la dimensión del modelo de espacio vectorial. Y finalmente, la array de distancia se calcula utilizando la distancia euclidiana .
A continuación, medimos la similitud semántica dentro de un espacio semántico utilizando una base de conocimientos. Aquí, calculamos la distancia entre los synsets correspondientes usando WordNet . Luego calculamos el camino más corto y la profundidad máxima de la taxonomía utilizando la métrica de Leacock y Chodorow .
Finalmente, determinamos la similitud química, donde representamos la molécula en forma 2D utilizando vectores de huellas dactilares y calculamos la similitud. Los dos vectores de huellas dactilares utilizados aquí son MACCS y ECFPS , y el coeficiente de los vectores se calcula utilizando el coeficiente de Tanimoto.
Puede consultar la versión del editor para obtener más información.
2. Hacia un codificador de red neuronal universal para series temporales
El análisis de series de tiempo ha atraído mucha atención debido a sus resultados de pronóstico cuantitativos y cualitativos. Sin embargo, la mayoría de los enfoques relacionados con las clasificaciones de series temporales se centran en datos de series temporales de longitud uniforme, datos unidimensionales y datos no etiquetados. Pero, en casos en tiempo real, pueden surgir datos de series temporales desiguales debido a varios escenarios, lo que subraya la necesidad de tratar con una longitud variable de datos. Y también en ciertos casos, como el pronóstico de la demanda y las predicciones financieras, es necesario combinar un patrón global con una calibración local en lugar de confiar en datos unidimensionales. Sobre todo, es importante identificar las características explicables de los datos de series temporales en lugar de proporcionar datos sin etiquetar.
En este proyecto de inteligencia artificial, usamos un codificador de red neuronal universal para abordar los desafíos identificados relacionados con longitud variable, alta dimensión y algunos datos etiquetados . El codificador que consideramos es una red de convolución estándar ; Aquí, la convolución aborda los desafíos relacionados con los datos de alta dimensión. Esta red de convolución se combina con un mecanismo de atención temporal para superar los desafíos relacionados con las representaciones de datos de longitud variable. Y para los datos etiquetados, usamos una red universal entrenada con una variedad de conjuntos de datos. Finalmente, para tratar la clasificación de series temporales se utilizan los algoritmos COTE y HIVE-COTE .
Puede consultar la versión del editor para obtener más información.
3. Perfiles de navegación de patrones web para campañas de marketing en línea
En la era digital actual, es simplemente imposible para la mayoría de la población realizar sus actividades cotidianas sin utilizar Internet. Este uso de internet ha abierto muchas posibilidades en la promoción de productos y también en la oferta de servicios. Pero con miles de millones de personas navegando por Internet, es importante dirigirse al cliente adecuado para las promociones de su producto o proporcionar una solución basada en sus necesidades. La mejor estrategia para comprender el comportamiento de los usuarios es analizar su patrón de navegación en línea. Con las técnicas de Web-mining se puede extraer información de calidad relacionada con los intereses de los usuarios y sus necesidades.
Este proyecto basado en IA tiene como objetivo proporcionar datos de calidad a través de perfiles de navegación de patrones web para personalizar campañas de marketing en línea eficientes. Aquí, consideramos diferentes perfiles de navegación basados en la secuencia ordenada consecutiva de dominio visitado , en lugar de considerar una bolsa de sitios web. Examina ciertos perfiles sociodemográficos como la región, la edad, la clase social y el número de familiares en el hogar, e identifica las secuencias contiguas frecuentes.
Los datos utilizados en este proyecto representan a los internautas españoles y son propiedad de Kantar Worldpanel . Y para el procesamiento de datos, el algoritmo M3 se usa para identificar todas las diferentes secuencias de sitios web en función de los visitantes en una muestra determinada. Este algoritmo es eficiente para extraer secuencias estándar de sitios web para un segmento de usuarios en particular. Luego, los datos extraídos se corrigen utilizando la corrección de Bonferroni y la corrección de tasa de descubrimiento falso . Por lo tanto, puede adaptar una campaña de marketing eficiente para dirigirse a un segmento de usuario específico.
Puede consultar la versión del editor para obtener más información.
4. ¿Los mensajes positivos de Twitter tienen un impacto en la liquidez de las acciones?
Un modelo de predicción de existencias preciso juega un papel clave en la planificación comercial, pero al mismo tiempo es una tarea desafiante. Al analizar los precios históricos utilizando un sistema basado en el conocimiento y el aprendizaje automático, puede analizar el ciclo del mercado de valores. Sin embargo, estudios recientes muestran que las redes sociales pueden tener un impacto en la liquidez de las acciones.
Durante los últimos años, las redes sociales han cambiado la forma en que las personas interactúan entre sí. Los servicios de microblogging proporcionados por estas plataformas facilitan la rápida difusión de información en todo el mundo. En este proyecto basado en IA, analizamos cómo los mensajes de Twitter pueden influir en los sentimientos y el comportamiento de los accionistas .
La volatilidad juega un papel importante en el mercado de valores. Para medir la volatilidad del mercado de valores, es necesario considerar la liquidez de las acciones. Dado que la liquidez depende directamente de la funcionalidad de una empresa, la información relacionada con la empresa publicada en las redes sociales tiene un gran impacto en los sentimientos de Twitter.
Aquí consideramos dos conjuntos de datos para la predicción de existencias. Un conjunto de datos tiene la información relacionada con el precio de las acciones o el volumen de la bolsa de valores en un período determinado. Este conjunto de datos es necesario porque la velocidad y el precio son las dos características importantes relacionadas con la liquidez. Desempeña un papel importante en la toma de decisiones comerciales. El segundo conjunto de datos tiene la información extraída de los archivos de Twitter . Al usar ambos conjuntos de datos, puede identificar las correlaciones y las bajas entre diferentes variables y segmentos de los problemas. Para analizar los datos relacionados con la liquidez, debe calcularlos utilizando la medida de Amihuds . Y para analizar la correlación, se considera la polaridad promedio del sentimiento por día junto con la tasa de iliquidez. Finalmente, se determina una correlación lineal usandoCoeficiente de correlación de Pearson .
Puede consultar la versión del editor para obtener más información.
Resumen
La Inteligencia Artificial se considera una tecnología emergente y pionera, indispensable para el sector económico y la sociedad actual. Según los informes, existe una gran demanda de talentos de IA en el mercado, y las soluciones de IA están al rojo vivo en la actualidad. En esta función, discutimos las 4 mejores ideas de proyectos avanzados que mejoran sus habilidades de IA. Al trabajar en estas ideas de proyectos, puede convertirse en uno de los cerebros brillantes que brindan soluciones de IA de calidad. Terminemos con las palabras de Geoffrey Hinton,
“Siempre he estado convencido de que la única forma de hacer que la inteligencia artificial funcione es hacer el cálculo de forma similar al cerebro humano. Ese es el objetivo que he estado persiguiendo. Estamos progresando, aunque todavía tenemos mucho que aprender sobre cómo funciona realmente el cerebro”. – Geoffrey Hinton , famoso científico de IA.
Publicación traducida automáticamente
Artículo escrito por SonuGeorge y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA