Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Romariz, Alexandre Ricardo Soares | - |
dc.contributor.author | Bafutto, Matheus Clemente | - |
dc.identifier.citation | BAFUTTO, Matheus Clemente. Sistema de detecção e reconhecimento de números baseado em cascata de classificadores e redes neurais. 2018. 53 f., il. Trabalho de Conclusão Curso (Bacharelado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2018. | pt_BR |
dc.description | Trabalho de Conclusão Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018. | pt_BR |
dc.description.abstract | Grandes avanços tem sido observados nos processadores modernos nas últimas décadas.
Ano após ano a capacidade de processamento de computadores e dispositivos eletrônicos
aumenta em ritmo exponencial. Este aumento no poder de processamento acelera a execução
de algoritmos de aprendizado de máquina e viabiliza seu uso em novos campos como na
segurança, robótica e saúde. Além disso, a introdução e massificação dos chamados
dispositivos móveis, ou smartphones, contribuíram para o barateamento e acessibilidade à
tecnologia fotográfica e de gravação de vídeos com qualidade. Neste contexto, estudos de
visão computacional como detecção de texto passam a ser viáveis. Detecção de texto é um
problema complexo, porém sua solução permite aplicações interessantes como OCR em
documentos impressos e alternativas de automação para a robótica.
Este trabalho apresenta um sistema de detecção e reconhecimento exclusivo para números,
tanto escritos como impressos. A implementação da detecção de números foi alcançada por
meio da associação das técnicas de visão computacional “cascata de classificadores”,
“pirâmide de imagens”, “método da janela móvel” e “geração manual de características
Haar”. A classificação dos números detectados foi realizada utilizando-se duas alternativas,
um modelo de rede neural multi-camada e um modelo de convolução.
A detecção de números foi validada com um grupo de exemplos criados manualmente.
Foram extraídos parâmetros da matriz de confusão do detector e também foi calculada sua
nota F1, atingindo o máximo de 0.4194. A classificação foi validada por meio do grupo de
exemplos da base de dados MNIST, em que o melhor desempenho foi registrado no valor
97.5% e 99% para o modelo de rede multi-camada e convolucional respectivamente. O
sistema completo também foi validado em um grupo de exemplos criado à mão, em que o
melhor desempenho teve acurácia de 90%. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Redes neurais (Computação) | pt_BR |
dc.subject.keyword | Reconhecimento Óptico de Caracteres (OCR) | pt_BR |
dc.subject.keyword | Aprendizado de máquina | pt_BR |
dc.subject.keyword | Algoritmos | pt_BR |
dc.subject.keyword | Imagens - estudo | pt_BR |
dc.title | Sistema de detecção e reconhecimento de números baseado em cascata de classificadores e redes neurais | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2021-08-24T00:06:19Z | - |
dc.date.available | 2021-08-24T00:06:19Z | - |
dc.date.submitted | 2018-07-05 | - |
dc.identifier.uri | https://bdm.unb.br/handle/10483/28277 | - |
dc.language.iso | Português | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. | pt_BR |
dc.description.abstract1 | Big advancements have been happening on modern computing hardware within the last
decades. Year after year processors and electronic devices have been rising their speed and
capabilities, all of this at an exponencial level. This rising on processing power accelerates the
execution of complex algorithms from the machine learning field, and this enables their use in
new fields of robotics, surveillance and healthcare. Besides all stated about processors, the
introduction and wide adoption of mobile devices, or smartphones, contributed the decrease
in costs and improvements on accessibility to high quality video recording technology. In this
scenario, there has been a surge in studies about computer vision and its applications under
these conditions. Text detection is a complex problem related to computer vision, and
solutions to it could enable interesting applications such as photo optical character recognition
on printed documents as well as new ways to automate processes in robotics.
This work presents a system for detecting and recognizing numbers, both written and
printed. Number detection was implemented by making use of computer vision techniques
like cascade classifiers, image pyramids, the sliding window method along with manual
feature generation method “Haar”. Number recognition was done by training two different
machine learning classifiers, a multi-layer neural network and a convolutional neural network.
The digit detection system was validated with a group of hand crafted examples. A
confusion matrix was extracted from the detector’s performance on the set and its f1 score
was calculated, achieving a maximum value of 0.4194. Classification was validated by
making use of the MNIST dataset, on which each classifier’s accuracy was registered,
reaching a maximum of 97.5% for the multi-layer neural net and 99% for the convolutional
model. Validation for the system as a whole was also performed by making use of a hand
crafted dataset, to which the system achieved a best accuracy of 90%. | pt_BR |
Aparece na Coleção: | Engenharia Elétrica
|