Visión artificial – Introducción

¿Alguna vez te has preguntado cómo podemos entender las cosas que vemos? Al igual que vemos a alguien caminando, nos demos cuenta o no, utilizando el conocimiento previo, nuestro cerebro entiende lo que está sucediendo y lo almacena como información. Imagina que miramos algo y nos quedamos completamente en blanco. En el olvido. ¿Aterrador verdad? Bueno, el secreto detrás de cómo nuestro cerebro interpreta las imágenes que vemos siempre me ha intrigado.

La idea de impartir inteligencia e instintos humanos a una computadora parece bastante sencilla. Posiblemente, porque también lo resuelven niños muy pequeños, pero a menudo tendemos a olvidar las limitaciones de las computadoras en comparación con nuestras capacidades biológicas. La complejidad de la percepción de la visión varía infinitamente y es siempre dinámica en el caso de los propios seres humanos, por no hablar de la inteligencia informática.

Nuestro cerebro tiene la capacidad de identificar el objeto, procesar datos y decidir qué hacer, completando así una tarea compleja en una fracción de segundo. El objetivo es permitir que las computadoras puedan hacer lo mismo. Por lo tanto, es un campo al que se puede hacer referencia como una amalgama de inteligencia artificial y aprendizaje automático, que implica aprender algoritmos y métodos especializados para interpretar lo que ve la computadora.

El principio

Inicialmente, las mismas personas que fueron pioneras en Inteligencia Artificial pensaron que la idea desconcertante sobre la que los gigantes tecnológicos todavía tienen ideas, era lo suficientemente simple para un proyecto de verano de pregrado. Volviendo a 1966, cuando Seymour Papert y Marvin Minsky del grupo de Inteligencia Artificial del MIT comenzaron un proyecto en el que el objetivo era construir un sistema que pudiera analizar una escena e identificar los objetos en ella.

Aprendizaje profundo

La ciencia detrás de Computer Vision gira en torno a las redes neuronales artificiales. ¿En palabras simples? Los algoritmos inspirados en el cerebro humano que aprenden usando grandes cantidades de conjuntos de datos para clonar los instintos humanos lo más cerca posible. Estos algoritmos tienen una precisión superior, incluso superando el nivel humano en algunas tareas. Simplemente un subconjunto de Deep Learning, Deep Vision es lo que impulsa Computer Vision.

Extracción de píxeles

OpenCV (Open Source Computer Vision), una biblioteca de funciones multiplataforma y de uso gratuito se basa en Computer Vision en tiempo real que admite marcos de aprendizaje profundo que ayudan en el procesamiento de imágenes y videos. En Computer Vision, el elemento principal es extraer los píxeles de la imagen para estudiar los objetos y así entender lo que contiene. A continuación se presentan algunos aspectos clave que Computer Vision busca reconocer en las fotografías:

  • Detección de objetos: la ubicación del objeto.
  • Reconocimiento de objetos: los objetos en la imagen y sus posiciones.
  • Clasificación de objetos: la amplia categoría en la que se encuentra el objeto.
  • Segmentación de objetos: los píxeles que pertenecen a ese objeto.

Aplicaciones y Futuro

Computer Vision cubre un terreno enorme ya que sus aplicaciones no conocen límites. A menudo se nos escapa de la mente cuando no nos damos cuenta del papel que juega Computer Vision en los dispositivos que usamos día tras día.

  • Teléfonos inteligentes y web: Google Lens, códigos QR, filtros de Snapchat (seguimiento de rostros), vista nocturna, detección de rostros y expresiones, desenfoque de lentes, modo retrato, Google Photos (reconocimiento de rostros, objetos y escenas), Google Maps (unión de imágenes).
  • Imágenes médicas: CAT/MRI
  • Seguros: Inspección de Propiedad y Análisis de Daños
  • Reconocimiento óptico de caracteres (OCR)
  • Construcción de modelos 3D (fotogrametría)
  • Fusión de CGI con actores en vivo en películas

Computer Vision es un área de estudio en constante evolución, con tareas y técnicas personalizadas especializadas para apuntar a dominios de aplicaciones. Visualizo su valor de mercado creciendo tan rápido como sus capacidades. Con nuestra inteligencia e interés, pronto podremos combinar nuestras habilidades con Computer Vision y alcanzar nuevas alturas.

Publicación traducida automáticamente

Artículo escrito por anikait8900 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *