OCR de dígitos manuscritos | OpenCV

OCR , que significa reconocimiento óptico de caracteres , es una técnica de visión por computadora que se utiliza para identificar los diferentes tipos de dígitos escritos a mano que se utilizan en las matemáticas comunes. Para realizar OCR en OpenCV, usaremos el algoritmo KNN que detecta los k vecinos más cercanos de un punto de datos en particular y luego clasifica ese punto de datos según el tipo de clase detectado para n vecinos.

Datos utilizados

digits1

Estos datos contienen 5000 dígitos escritos a mano donde hay 500 dígitos para cada tipo de dígito. Cada dígito tiene unas dimensiones de 20 × 20 píxeles. Dividiremos los datos de manera que 250 dígitos sean para entrenamiento y 250 dígitos para pruebas para cada clase.

A continuación se muestra la implementación.

import numpy as np
import cv2
   
      
# Read the image
image = cv2.imread('digits.png')
  
# gray scale conversion
gray_img = cv2.cvtColor(image,
                        cv2.COLOR_BGR2GRAY)
  
# We will divide the image
# into 5000 small dimensions 
# of size 20x20
divisions = list(np.hsplit(i,100) for i in np.vsplit(gray_img,50))
  
# Convert into Numpy array
# of size (50,100,20,20)
NP_array = np.array(divisions)
   
# Preparing train_data
# and test_data.
# Size will be (2500,20x20)
train_data = NP_array[:,:50].reshape(-1,400).astype(np.float32)
  
# Size will be (2500,20x20)
test_data = NP_array[:,50:100].reshape(-1,400).astype(np.float32)
  
# Create 10 different labels 
# for each type of digit
k = np.arange(10)
train_labels = np.repeat(k,250)[:,np.newaxis]
test_labels = np.repeat(k,250)[:,np.newaxis]
   
# Initiate kNN classifier
knn = cv2.ml.KNearest_create()
  
# perform training of data
knn.train(train_data,
          cv2.ml.ROW_SAMPLE, 
          train_labels)
   
# obtain the output from the
# classifier by specifying the
# number of neighbors.
ret, output ,neighbours,
distance = knn.findNearest(test_data, k = 3)
   
# Check the performance and
# accuracy of the classifier.
# Compare the output with test_labels
# to find out how many are wrong.
matched = output==test_labels
correct_OP = np.count_nonzero(matched)
   
#Calculate the accuracy.
accuracy = (correct_OP*100.0)/(output.size)
   
# Display accuracy.
print(accuracy)

Producción

91.64

Publicación traducida automáticamente

Artículo escrito por KaranGupta5 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *