Título del proyecto: Clasificador de imágenes de perros y gatos
Introducción:
Este proyecto tiene como objetivo clasificar la imagen de entrada como una imagen de perro o gato. Se analizará la entrada de imagen que le dé al sistema y el resultado predicho se dará como salida. El algoritmo de aprendizaje automático [Redes neuronales convolucionales] se utiliza para clasificar la imagen.
El modelo así implementado puede extenderse a un dispositivo móvil oa cualquier sitio web según la necesidad del desarrollador.
Puede obtener el código completo del proyecto aquí .
Marco Conceptual:
El proyecto está completamente implementado usando Python3. El Marco Conceptual involucrado es principalmente:
- Keras: backend de Tensorflow
- OpenCV: se utiliza para manejar operaciones de imagen
Para comprender el flujo de trabajo, consulte la imagen adjunta a continuación o haga clic aquí .
Método:
Paso 1: obtener el conjunto de datos
El conjunto de datos está disponible aquí .
Paso 2: Instalación de los paquetes necesarios [Python 3.6]
1. OpenCV —> ‘3.4.0’ [Se usa para manejar operaciones de imagen como leer la imagen, cambiar el tamaño, remodelar]
2. numpy —> ‘1.14.4’ [La imagen que se lee se almacenará en una array numpy]
3. TensorFlow —> ‘1.8.0’ [Tensorflow es el backend de Keras]
4. Keras —> ‘2.1.6’ [Keras se usa para implementar la CNN]
Paso 3: ¿Cómo funciona el modelo?
El conjunto de datos contiene muchas imágenes de gatos y perros. Nuestro objetivo es hacer que el modelo aprenda las características distintivas entre el gato y el perro. Una vez que el modelo haya aprendido, es decir, una vez que el modelo haya sido entrenado, podrá clasificar la imagen de entrada como un gato o un perro.
Características proporcionadas:
- Se puede probar la propia imagen para verificar la precisión del modelo.
- Este código se puede integrar directamente con su proyecto actual o se puede extender como una aplicación móvil o un sitio.
- Para extender el proyecto para clasificar diferentes entidades, todo lo que necesita hacer es encontrar el conjunto de datos adecuado, cambiar el conjunto de datos en consecuencia y entrenar el modelo.
Diagrama/Salida:
Estructuras de datos y algoritmos utilizados en el proyecto.
- Numpy Array: esta estructura de datos de python, la más potente y ampliamente utilizada, se utiliza para almacenar el valor de píxel de las imágenes.
Herramientas utilizadas:
- Intérprete de Python
- Indicación de anaconda
- espía
Enlace Github: https://github.com/Yatheen07/cat-dog-image-classifier
Aplicaciones:
Este proyecto da una idea general de cómo se puede hacer eficientemente la clasificación de imágenes. El alcance del proyecto se puede extender a las diversas industrias donde existe un gran alcance para la automatización, simplemente modificando el conjunto de datos que es relevante para el problema.
Publicación traducida automáticamente
Artículo escrito por Yatheendra_Pravan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA