Reconocimiento de caracteres ópticos OCR por medio de correlación y redes neuronales
Fecha
2013-07-16Autor
Durán Gómez, Mauricio
Director/Asesor
Villamizar Rincón, Juan Carlos
Tipo de contenido
bacherlorThesis
Citación
Metadatos
Mostrar el registro completo del ítemDocumentos PDF
Resumen
Esta tesis tiene como objetivo general el estudio y la aplicación de un sistema que realice el reconocimiento de caracteres ópticos en imágenes previamente tomadas o capturadas. Se empieza el reconocimiento a partir de la digitalización del texto que puede ser a través de una cámara, un escáner o capturando la imagen del carácter escrito por medio de un lápiz óptico. Como primer paso, se realiza un tratamiento de la imagen capturada, pasando desde la binarización de la imagen hasta el filtrado que elimina el ruido que la distorsiona. El sistema de reconocimiento desarrollado es dependiente del escritor, por lo que cada sistema de clasificación escogido para reconocer el carácter debe ser previamente adaptado para que pueda realizar el proceso de reconocimiento de la manera correcta. Sin embargo, se tiene en estos métodos de clasificación una gran variedad de ejemplos de entrenamiento, muestras y plantillas que permitirán en un alto índice, el reconocimiento de caracteres manuscritos de terceros en el programa. Para el proyecto se utilizaron dos métodos de clasificación muy conocidos para relacionar imágenes y crear variables de similitud para la correcta etiquetación de los caracteres a reconocer. Estos dos métodos son los de correlación y la de redes neuronales. El método de correlación da como resultado un valor de relación entre los datos o patrones de las imágenes y dicha relación puede calcularse mediante diversos coeficientes que miden el grado de correlación entre las mismas. Por otro lado, las redes neuronales serán entrenadas de tal forma que el sistema pueda identificar de un conjunto de posibles soluciones la mejor de las salidas en relación al dato de entrada del sistema. Una vez se hayan extraído y clasificados los patrones del carácter de entrada, queda por último la etiquetación del carácter de salida correctamente reconocido. This thesis aims to study the general and the implementation of a system to perform optical character recognition on images previously taken or caught. It starts from the recognition of digitized text that can be through a camera, scanner, or capturing the image of the character written by a stylus. As a first step, is a treatment of the captured image, moving from the binarization of the image to the filter that removes noise distortion. The recognition system developed is dependent on the writer, so each classification system chosen to recognize the character must first be adjusted so that you can make the process of recognizing the right way. However it is these methods of classification in a variety of training examples, samples and templates that allow a high rate, the recognition of handwritten characters in the third. The project will use two well-known classification methods to link images and create similar variables for the correct labeling of the characters to recognize. These two methods are the correlation and the neural network. The correlation method results in a value of relationships between data or patterns of images and this ratio can be calculated using various ratios that measure the degree of correlation between them. On the other hand neural networks are trained so that the system can identify a set of possible solutions the best of trips in relation to the input of the system. Once you have collected and classified the patterns of character input, is by labeling the last character output correctly recognized.
Palabra/s clave
Ingeniería electrónica
Tesis y disertaciones académicas
Lápiz óptico
Tratamiento de imágenes [electrónica]
Redes [electrónica]
Colecciones
- Trabajos de grado [6349]