La tecnología actual sorprende a las personas con innovaciones asombrosas que no solo hacen la vida más simple sino también soportable. Con el tiempo, el reconocimiento facial ha demostrado ser la forma de verificación biométrica menos intrusiva y más rápida.
El reconocimiento facial es una categoría de software biométrico que mapea las características faciales de un individuo y almacena los datos como una impresión facial. El software utiliza algoritmos de aprendizaje profundo para comparar una imagen capturada en vivo con la impresión facial almacenada para verificar la identidad de uno. El procesamiento de imágenes y el aprendizaje automático son la columna vertebral de esta tecnología. El reconocimiento facial ha recibido una atención considerable por parte de los investigadores debido a las actividades humanas que se encuentran en diversas aplicaciones de seguridad como un aeropuerto, detección de delincuentes, seguimiento de rostros, análisis forense, etc. En comparación con otros rasgos biométricos como la huella de la palma, el iris, la huella dactilar, etc., la biometría facial puede ser no intrusivo.
Se pueden tomar incluso sin el conocimiento del usuario y además se pueden usar para aplicaciones basadas en la seguridad, como detección de delincuentes, seguimiento de rostros, seguridad de aeropuertos y sistemas de vigilancia forense. El reconocimiento facial implica capturar imágenes faciales de un video o una cámara de vigilancia. Se comparan con la base de datos almacenada. El reconocimiento facial implica entrenar imágenes conocidas, clasificarlas con clases conocidas y luego almacenarlas en la base de datos. Cuando se entrega una imagen de prueba al sistema, se clasifica y se compara con la base de datos almacenada.
El procesamiento de imágenes por computadoras involucra el proceso de visión por computadora. Se trata de la comprensión de alto nivel de imágenes o videos digitales. El requisito es automatizar las tareas que pueden realizar los sistemas visuales humanos. Entonces, una computadora debería poder reconocer objetos como el rostro de un ser humano o una farola o incluso una estatua.
Lectura de imágenes
La computadora lee cualquier imagen como un rango de valores entre 0 y 255. Para cualquier imagen en color, hay 3 colores primarios: rojo, verde y azul. Se forma una array para cada color primario y luego estas arrays se combinan para proporcionar un valor de píxel para los colores R, G, B individuales. Cada elemento de las arrays proporciona datos sobre la intensidad del brillo del píxel.
OpenCV es una biblioteca de Python que está diseñada para resolver problemas de visión por computadora. OpenCV fue desarrollado originalmente en 1999 por Intel, pero luego fue respaldado por Willow Garage. OpenCV admite una variedad de lenguajes de programación como C++, Python, Java, etc. Compatibilidad con múltiples plataformas, incluidas Windows, Linux y macOS. OpenCV Python es una clase contenedora para la biblioteca C++ original que se utilizará con Python. Con esto, todas las estructuras de array de OpenCV se convierten a/desde arrays NumPy. Esto facilita la integración con otras bibliotecas que usan NumPy. Por ejemplo, bibliotecas como SciPy y Matplotlib.
Aprendizaje automático
Cada algoritmo de Machine Learning toma un conjunto de datos como entrada y aprende de los datos, lo que básicamente significa aprender el algoritmo de la entrada y la salida proporcionadas como datos. Identifica los patrones en los datos y proporciona el algoritmo deseado. Por ejemplo, para identificar el rostro de quién está presente en una imagen determinada, se pueden observar varias cosas como un patrón:
- Alto/ancho de la cara.
- Es posible que la altura y el ancho no sean confiables, ya que la imagen podría volver a escalarse a una cara o cuadrícula más pequeña. Sin embargo, incluso después de cambiar la escala, lo que permanece sin cambios son las proporciones: la proporción entre la altura de la cara y el ancho de la cara no cambiará.
- Color de la cara.
- Ancho de otras partes de la cara como labios, nariz, etc.
Hay un patrón involucrado: diferentes caras tienen diferentes dimensiones como las de arriba. Las caras similares tienen dimensiones similares. Los algoritmos de aprendizaje automático solo entienden números, por lo que es bastante desafiante. Esta representación numérica de una «cara» (o un elemento en el conjunto de entrenamiento) se denomina vector de características. Un vector de características se compone de varios números en un orden específico.
Como un ejemplo simple, podemos mapear una «cara» en un vector de características que puede comprender varias características como:
- Altura de la cara (cm)
- Ancho de la cara (cm)
- Color promedio de la cara (R, G, B)
- Ancho de labios (cm)
- Altura de la nariz (cm)
Esencialmente, dada una imagen, podemos convertirla en un vector de características como:
Altura de la cara (cm) Ancho de la cara (cm) Color medio de la cara (RGB) Ancho de los labios (cm) Altura de la nariz (cm)
23,1 15,8 (255, 224, 189) 5,2 4,4
Entonces, la imagen ahora es un vector que podría representarse como (23.1, 15.8, 255, 224, 189, 5.2, 4.4). Podría haber otras innumerables características que podrían derivarse de la imagen, por ejemplo, el color del cabello, el vello facial, las gafas, etc.
El aprendizaje automático realiza dos funciones principales en la tecnología de reconocimiento facial. Estos se dan a continuación:
- Derivación del vector de funciones: es difícil enumerar manualmente todas las funciones porque hay demasiadas. Un algoritmo de aprendizaje automático puede etiquetar de forma inteligente muchas de estas características. Por ejemplo, una característica compleja podría ser la relación entre la altura de la nariz y el ancho de la frente.
- Algoritmos de coincidencia: una vez que se han obtenido los vectores de características, un algoritmo de aprendizaje automático debe hacer coincidir una nueva imagen con el conjunto de vectores de características presentes en el corpus.
- Operaciones de reconocimiento facial
El sistema de tecnología puede variar cuando se trata de reconocimiento facial. Cada software aplica diferentes métodos y medios para lograr el reconocimiento facial. El método paso a paso es el siguiente:
- Detección de rostros: para empezar, la cámara detectará y reconocerá un rostro. La cara se puede detectar mejor cuando la persona está mirando directamente a la cámara, ya que facilita el reconocimiento facial. Con los avances en la tecnología, esto se mejora cuando se puede detectar el rostro con una ligera variación en su postura del rostro frente a la cámara.
- Análisis de la cara: Luego se captura y analiza la foto de la cara. La mayor parte del reconocimiento facial se basa en imágenes 2D en lugar de 3D porque es más conveniente hacer coincidir con la base de datos. El software de reconocimiento facial analizará la distancia entre tus ojos o la forma de tus pómulos.
- Conversión de imagen a datos: ahora se convierte en una fórmula matemática y estas características faciales se convierten en números. Este código numérico se conoce como impresión facial. De la misma manera que cada persona tiene una huella digital única, de la misma manera, tienen una huella facial única.
- Búsqueda de coincidencias: Luego, el código se compara con una base de datos de otras impresiones faciales. Esta base de datos tiene fotos con identificación que se pueden comparar. Luego, la tecnología identifica una coincidencia para sus características exactas en la base de datos provista. Vuelve con la coincidencia y la información adjunta, como el nombre y la dirección, o depende de la información guardada en la base de datos de un individuo.
Muchas empresas de renombre están constantemente innovando e improvisando para desarrollar software de reconocimiento facial que sea infalible y confiable. Algunos software prominentes se discuten a continuación:
una. IA de visión profunda
Deep Vision AI es una empresa pionera que se destaca en el software de reconocimiento facial. La empresa posee la propiedad de tecnología avanzada de visión por computadora que puede comprender imágenes y videos automáticamente. Luego convierte el contenido visual en análisis en tiempo real y proporciona información muy valiosa.
Deep Vision AI proporciona una plataforma plug and play a sus usuarios en todo el mundo. Los usuarios reciben alertas en tiempo real y una respuesta más rápida basada en el análisis de los flujos de cámara a través de varios módulos basados en IA. El producto ofrece una tasa muy precisa de identificación de personas en una lista de vigilancia mediante el control continuo de las zonas objetivo. El software es muy flexible y se puede conectar a cualquier sistema de cámara existente o se puede implementar a través de la nube.
En la actualidad, Deep Vision AI ofrece la mejor solución de rendimiento del mercado que admite procesamiento en tiempo real a más de 15 flujos por GPU.
La recopilación de inteligencia comercial se ayuda al proporcionar datos en tiempo real de los clientes, la frecuencia de sus visitas o la mejora de la seguridad y la protección. Además, la salida del software puede proporcionar atributos como recuento, edad, sexo, etc., que pueden mejorar la comprensión del comportamiento del consumidor, las preferencias cambiantes, los cambios con el tiempo y las condiciones que pueden guiar los esfuerzos y estrategias de marketing futuros. Los usuarios también combinan las capacidades de reconocimiento facial con otras funciones basadas en IA de Deep Vision AI, como el reconocimiento de vehículos, para obtener más datos correlacionados de los consumidores.
La empresa cumple con las leyes internacionales de protección de datos y aplica importantes medidas para un tratamiento transparente y seguro de los datos generados por sus clientes. Se cuida la privacidad de los datos y la ética.
Los mercados potenciales incluyen ciudades, lugares públicos, transporte público, institutos educativos, grandes minoristas, etc. Deep Vision AI es un socio certificado para Metropolis de NVIDIA, Dell Digital Cities, Amazon AWS, Microsoft, Red Hat y otros.
b. SenseTime
- SenseTime es un desarrollador de plataformas líder que ha dedicado esfuerzos para crear soluciones utilizando las innovaciones en IA y análisis de big data. La tecnología que ofrece SenseTime es multifuncional. Los aspectos de esta tecnología se están expandiendo e incluyen las capacidades de reconocimiento facial, reconocimiento de imágenes, análisis de video inteligente, conducción autónoma y reconocimiento de imágenes médicas. El software SenseTime incluye diferentes subpartes, a saber, SensePortrait-S, SensePortrait-D y SenseFace.
- SensePortrait-S es un servidor de reconocimiento facial estático. Incluye la funcionalidad de detección de rostros de una fuente de imagen, extracción de características, extracción y análisis de atributos y recuperación de objetivos de una amplia base de datos de imágenes faciales.
- SensePortrait D es un servidor de reconocimiento facial dinámico. Las capacidades incluidas son la detección de rostros, el seguimiento de un rostro, la extracción de características y la comparación y el análisis de datos a partir de datos en múltiples flujos de video de vigilancia.
- SenseFace es una plataforma de vigilancia de reconocimiento facial. Esta utilidad es una tecnología de reconocimiento facial que utiliza un algoritmo de aprendizaje profundo. SenseFace es muy eficiente en soluciones integradas para análisis de video inteligente. Se puede utilizar ampliamente para la vigilancia de objetivos, el análisis de la trayectoria de una persona, la gestión de la población y el análisis de datos asociados, etc.
- SenseTime ha brindado sus servicios a muchas empresas y agencias gubernamentales, incluidas Honda, Qualcomm, China Mobile, UnionPay, Huawei, Xiaomi, OPPO, Vivo y Weibo.
C. Reconocimiento de Amazon
Amazon proporciona una solución de software basada en la nube Amazon Rekognition es una plataforma de servicios de visión artificial. Esta solución permite un método fácil para agregar análisis de imágenes y videos a varias aplicaciones. Utiliza una tecnología de aprendizaje profundo altamente escalable y probada. No se requiere que el usuario tenga experiencia en aprendizaje automático para usar este software. La plataforma se puede utilizar para identificar objetos, texto, personas, actividades y escenas en imágenes y videos. También puede detectar cualquier contenido inapropiado. El usuario obtiene un análisis facial de alta precisión y capacidades de búsqueda facial. Por lo tanto, el software se puede usar fácilmente para la verificación, el conteo de personas y la seguridad pública mediante la detección, el análisis y la comparación de rostros.
Las organizaciones pueden utilizar las etiquetas personalizadas de Amazon Rekognition para generar datos sobre escenas y objetos específicos disponibles en imágenes de acuerdo con sus necesidades comerciales. Por ejemplo, se puede construir fácilmente un modelo para clasificar piezas específicas de máquinas en la línea de montaje o para detectar plantas en mal estado. El usuario simplemente proporciona las imágenes de los objetos o escenas que desea identificar y el servicio se encarga del resto.
d. Primera cara
El software FaceFirst garantiza la seguridad de las comunidades, transacciones seguras y excelentes experiencias para los clientes. FaceFirst es un software seguro, preciso, privado, rápido y escalable. También se incluyen soluciones plug-and-play para seguridad física, autenticación de identidad, control de acceso y análisis de visitantes. Se puede integrar fácilmente en cualquier sistema. Muchas organizaciones han utilizado esta plataforma de visión por computadora para reconocimiento facial y análisis de video automatizado para prevenir delitos y mejorar la participación del cliente.
Como proveedor líder de sistemas efectivos de reconocimiento facial, beneficia al comercio minorista, el transporte, la seguridad de eventos, los casinos y otras industrias y espacios públicos. FaceFirst garantiza la integración de la inteligencia artificial con los sistemas de vigilancia existentes para prevenir robos, fraudes y violencia.
mi. cara verdadera
TrueFace es un modelo líder de visión por computadora que ayuda a las personas a comprender los datos de su cámara y convertir los datos en información procesable. TrueFace es una solución de visión artificial local que mejora la seguridad de los datos y la velocidad de rendimiento. Las soluciones basadas en plataformas están específicamente capacitadas según los requisitos de implementación individual y funcionan de manera efectiva en una variedad de ecosistemas. El software otorga la máxima prioridad a la diversidad de datos de entrenamiento. Garantiza un rendimiento equivalente para todos los usuarios, independientemente de sus requisitos muy diferentes.
Trueface ha desarrollado una suite que consta de SDK y una solución de contenedor dockerizado basada en las capacidades de aprendizaje automático e inteligencia artificial. La suite puede convertir los datos de la cámara en inteligencia procesable. Puede ayudar a las organizaciones a crear un entorno más seguro e inteligente para sus empleados, clientes e invitados utilizando tecnologías de reconocimiento facial, detección de armas y verificación de edad.
F. Cara++
- Face++, es una plataforma abierta habilitada por la empresa china Megvii. Ofrece tecnologías de visión artificial. Permite a los usuarios integrar fácilmente las tecnologías de reconocimiento de análisis de imágenes basadas en aprendizaje profundo en sus aplicaciones.
- Face++ utiliza la inteligencia artificial y la visión artificial de maneras sorprendentes para detectar y analizar rostros y confirmar con precisión la identidad de una persona. Face ++ también es amigable para los desarrolladores, ya que es una plataforma abierta, de modo que cualquier desarrollador puede crear aplicaciones utilizando sus algoritmos. Esta característica ha resultado en hacer de Face++ la plataforma de reconocimiento facial más extensa del mundo, con 300.000 desarrolladores de 150 países usándola.
- El uso más significativo de Face++ ha sido su integración en la plataforma City Brain de Alibaba. Esto ha permitido el análisis de la red de CCTV en las ciudades para optimizar los flujos de tráfico y dirigir la atención de médicos y policías mediante la observación de incidentes.
gramo. Kairós
- Kairos es una solución de reconocimiento facial ética y de vanguardia disponible para desarrolladores y empresas de todo el mundo. Kairos se puede usar para el reconocimiento facial a través de la API en la nube de Kairos, o el usuario puede alojar a Kairos en sus servidores. La utilidad se puede utilizar para el control de datos, seguridad y privacidad. Las organizaciones pueden garantizar una mejor y más segura experiencia de accesibilidad a sus clientes.
- Kairos Face Recognition On-Premises tiene la ventaja adicional de controlar la privacidad y la seguridad de los datos, manteniendo los datos críticos internamente y a salvo de posibles terceros/hackers. La velocidad de los productos habilitados para el reconocimiento facial es muy mejorada porque no se encuentra con el problema de la demora y otros riesgos asociados con la implementación de la nube pública.
- Kairos es una arquitectura ultraescalable, de modo que la búsqueda de 10 millones de caras se puede realizar aproximadamente al mismo tiempo que 1 cara. Está siendo aceptado por el mercado con las manos abiertas.
H. Cognitec
FaceVACS Engine de Cognitec permite a los usuarios desarrollar nuevas aplicaciones para el reconocimiento facial. El motor es muy versátil ya que permite una API clara y lógica para una fácil integración en otros programas de software. Cognitec permite el uso de FaceVACS Engine a través de kits de desarrollo de software personalizados. La plataforma se puede adaptar fácilmente a través de un conjunto de funciones y módulos específicos para cada caso de uso y plataforma informática. Las capacidades de este software incluyen verificación de calidad de imagen, emisión segura de documentos y control de acceso mediante verificación precisa.
Las características distintivas incluyen:
- Una localización de rostros y un seguimiento de rostros muy potentes.
- Algoritmos eficientes para inscripción, verificación e identificación
- Comprobación precisa de la edad, el género, la edad, la exposición, la desviación de la pose, las gafas, los ojos cerrados, la detección de iluminación uniforme, el color no natural, la imagen y la geometría de la cara
- Cumple con los requisitos de los pasaportes electrónicos al proporcionar verificaciones y formato de tipo de imagen frontal completo ISO 19794-5
Si bien el reconocimiento facial puede parecer futurista, actualmente se usa de varias maneras. Aquí hay algunas aplicaciones sorprendentes de esta tecnología.
-
Identificación del trastorno genético:
Existen aplicaciones de atención médica como Face2Gene y software como Deep Gestalt que utiliza el reconocimiento facial para detectar un trastorno genético. Luego, esta cara se analiza y se compara con la base de datos existente de trastornos.
-
Industria aerea:
Algunas aerolíneas utilizan el reconocimiento facial para identificar a los pasajeros. Este escáner facial ayudaría a ahorrar tiempo y a evitar la molestia de realizar un seguimiento de un boleto.
-
Seguridad Hospitalaria:
El reconocimiento facial se puede usar en hospitales para mantener un registro de los pacientes que es mucho mejor que mantener registros y encontrar sus nombres y direcciones. Sería fácil para el personal usar esta aplicación y reconocer a un paciente y obtener sus detalles en segundos. En segundo lugar, se puede utilizar con fines de seguridad donde puede detectar si la persona es genuina o no o si es un paciente.
-
Detección de emociones y sentimientos:
La detección de emociones en tiempo real es otra aplicación valiosa del reconocimiento facial en el cuidado de la salud. Se puede utilizar para detectar las emociones que manifiestan los pacientes durante su estancia en el hospital y analizar los datos para determinar cómo se sienten. Los resultados del análisis pueden ayudar a identificar si los pacientes necesitan más atención en caso de que sientan dolor o estén tristes.
La tecnología de reconocimiento facial se enfrenta a varios desafíos. Los problemas y desafíos comunes que puede tener un sistema de reconocimiento facial al detectar y reconocer rostros se analizan en los siguientes párrafos.
- Pose: un sistema de reconocimiento facial puede tolerar casos con ángulos de rotación pequeños, pero se vuelve difícil detectar si el ángulo sería grande y si la base de datos no contiene todos los ángulos de la cara, entonces puede generar un problema.
- Expresiones: Debido a las emociones, el estado de ánimo humano varía y da como resultado diferentes expresiones. Con estas expresiones faciales, la máquina podría cometer errores para encontrar la identidad correcta de la persona.
- Envejecimiento: Con el tiempo y la edad el rostro cambia es único y no permanece rígido por lo que puede ser difícil identificar a una persona que ahora tiene 60 años.
- Oclusión: Oclusión significa bloqueo. Esto se debe a la presencia de varios objetos oclusivos como anteojos, barba, bigote, etc. en la cara, y cuando se captura una imagen, la cara carece de algunas partes. Tal problema puede afectar severamente el proceso de clasificación del sistema de reconocimiento.
- Iluminación: Iluminación significa variaciones de luz. Los cambios de iluminación pueden variar la magnitud general de la intensidad de la luz reflejada por un objeto, así como el patrón de sombreado y las sombras visibles en una imagen. Se reconoce ampliamente que el problema del reconocimiento facial sobre los cambios en la iluminación es difícil para los humanos y los algoritmos. Las dificultades que plantean las condiciones de iluminación son un desafío para los sistemas automáticos de reconocimiento facial.
- Identifica caras similares: Diferentes personas pueden tener una apariencia similar que a veces hace que sea imposible distinguirlas.
- Peligro de la vigilancia general automatizada
- Falta de un marco legal o regulatorio claro
- Violación de los principios de necesidad y proporcionalidad
- Violación del derecho a la privacidad
- Efecto en la cultura política democrática
Publicación traducida automáticamente
Artículo escrito por shreya_garg y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA