OpenCV – Descripción general

Visión por computador

La visión por computadora es un proceso mediante el cual podemos entender las imágenes y videos, cómo se almacenan y cómo podemos manipular y recuperar datos de ellos. Computer Vision es la base o se utiliza principalmente para la Inteligencia Artificial. Computer-Vision está desempeñando un papel importante en los automóviles autónomos, la robótica y las aplicaciones de corrección de fotos. 
 

OpenCV

OpenCV es la gran biblioteca de código abierto para la visión por computadora, el aprendizaje automático y el procesamiento de imágenes y ahora juega un papel importante en la operación en tiempo real, lo cual es muy importante en los sistemas actuales. Al usarlo, uno puede procesar imágenes y videos para identificar objetos, rostros o incluso la escritura a mano de un ser humano. Cuando se integra con varias bibliotecas, como NumPy, Python es capaz de procesar la estructura de array de OpenCV para su análisis. Para identificar el patrón de la imagen y sus diversas características, usamos el espacio vectorial y realizamos operaciones matemáticas en estas características. 

La primera versión de OpenCV fue la 1.0. OpenCV se publica bajo una licencia BSD y, por lo tanto, es gratuito tanto para uso académico como comercial . Tiene interfaces C++, C, Python y Java y es compatible con Windows, Linux, Mac OS, iOS y Android. Cuando se diseñó OpenCV, el enfoque principal fueron las aplicaciones en tiempo real para la eficiencia computacional. Todo está escrito en C/C++ optimizado para aprovechar el procesamiento multinúcleo. 
Mira las siguientes imágenes 
 

a partir de la imagen original de arriba, se pueden obtener muchas piezas de información que están presentes en la imagen original. Como en la imagen de arriba, hay dos caras disponibles y la persona (yo) en las imágenes lleva un brazalete, un reloj, etc., por lo que con la ayuda de OpenCV podemos obtener todo este tipo de información de la imagen original. 
Es la introducción básica a OpenCV, podemos continuar con las aplicaciones y todo lo demás en nuestros próximos artículos. 
Aplicaciones de OpenCV: Hay muchas aplicaciones que se resuelven usando OpenCV, algunas de ellas se enumeran a continuación 
 

  • Reconocimiento facial
  • Inspección y vigilancia automatizadas
  • número de personas – recuento (tráfico peatonal en un centro comercial, etc.)
  • Conteo de vehículos en las autopistas junto con sus velocidades.
  • Instalaciones de arte interactivo.
  • Detección de anamolia (defecto) en el proceso de fabricación (los productos defectuosos)
  • Unión de imágenes de Street View
  • Búsqueda y recuperación de videos/imágenes
  • Navegación y control de automóviles sin robot ni conductor
  • reconocimiento de objetos
  • Análisis de imágenes médicas
  • Películas: estructura 3D a partir del movimiento
  • Reconocimiento de anuncios de canales de TV

Funcionalidad OpenCV 
 

  • E/S de imagen/video, procesamiento, visualización (core, imgproc, highgui)
  • Detección de objetos/características (objdetect, features2d, nonfree)
  • Visión por computadora monocular o estéreo basada en geometría (calib3d, costura, videostab)
  • Fotografía computacional (foto, video, superres)
  • Aprendizaje automático y agrupamiento (ml, flann)
  • Aceleración CUDA (gpu)

Procesamiento de imágenes

El procesamiento de imágenes es un método para realizar algunas operaciones en una imagen, con el fin de obtener una imagen mejorada o extraer información útil de ella. 
Si hablamos de la definición básica de procesamiento de imágenes, entonces «El procesamiento de imágenes es el análisis y la manipulación de una imagen digitalizada, especialmente para mejorar su calidad».  
Imagen digital: 
una imagen puede definirse como una función bidimensional f(x, y), donde x e y son coordenadas espaciales (planas), y la amplitud de cualquier par de coordenadas (x, y) se denomina intensidad o nivel de gris de la imagen en ese punto. 
En otras palabras, una imagen no es más que una array bidimensional (3-D en el caso de imágenes en color) que está definida por la función matemática f (x, y) en cualquier punto está dando el valor de píxel en ese punto de un imagen, el valor del píxel describe qué tan brillante es ese píxel y de qué color debe ser. 
El procesamiento de imágenes es básicamente un procesamiento de señales en el que la entrada es una imagen y la salida es una imagen o características de acuerdo con los requisitos asociados con esa imagen. 
El procesamiento de imágenes incluye básicamente los siguientes tres pasos: 
 

  1. Importando la imagen
  2. Analizar y manipular la imagen.
  3. Salida en la que el resultado puede ser una imagen alterada o un informe que se basa en el análisis de imágenes

¿Cómo lee una computadora una imagen?  
Considere la siguiente imagen: 
 

Somos humanos, podemos distinguir fácilmente que es la imagen de una persona que soy yo. Pero si le preguntamos a la computadora “¿es mi foto?”. La computadora no puede decir nada porque no está averiguando todo por sí misma. 
La computadora lee cualquier imagen como un rango de valores entre 0 y 255. Para cualquier imagen en color, hay 3 canales principales: rojo, verde y azul.
 

Publicación traducida automáticamente

Artículo escrito por ramswarup_kulhary y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *