Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/28277
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2018_MatheusClementeBafutto_tcc.pdf4,37 MBAdobe PDFver/abrir
Título: Sistema de detecção e reconhecimento de números baseado em cascata de classificadores e redes neurais
Autor(es): Bafutto, Matheus Clemente
Orientador(es): Romariz, Alexandre Ricardo Soares
Assunto: Redes neurais (Computação)
Reconhecimento Óptico de Caracteres (OCR)
Aprendizado de máquina
Algoritmos
Imagens - estudo
Data de apresentação: 5-Jul-2018
Data de publicação: 24-Ago-2021
Referência: BAFUTTO, Matheus Clemente. Sistema de detecção e reconhecimento de números baseado em cascata de classificadores e redes neurais. 2018. 53 f., il. Trabalho de Conclusão Curso (Bacharelado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2018.
Resumo: Grandes avanços tem sido observados nos processadores modernos nas últimas décadas. Ano após ano a capacidade de processamento de computadores e dispositivos eletrônicos aumenta em ritmo exponencial. Este aumento no poder de processamento acelera a execução de algoritmos de aprendizado de máquina e viabiliza seu uso em novos campos como na segurança, robótica e saúde. Além disso, a introdução e massificação dos chamados dispositivos móveis, ou smartphones, contribuíram para o barateamento e acessibilidade à tecnologia fotográfica e de gravação de vídeos com qualidade. Neste contexto, estudos de visão computacional como detecção de texto passam a ser viáveis. Detecção de texto é um problema complexo, porém sua solução permite aplicações interessantes como OCR em documentos impressos e alternativas de automação para a robótica. Este trabalho apresenta um sistema de detecção e reconhecimento exclusivo para números, tanto escritos como impressos. A implementação da detecção de números foi alcançada por meio da associação das técnicas de visão computacional “cascata de classificadores”, “pirâmide de imagens”, “método da janela móvel” e “geração manual de características Haar”. A classificação dos números detectados foi realizada utilizando-se duas alternativas, um modelo de rede neural multi-camada e um modelo de convolução. A detecção de números foi validada com um grupo de exemplos criados manualmente. Foram extraídos parâmetros da matriz de confusão do detector e também foi calculada sua nota F1, atingindo o máximo de 0.4194. A classificação foi validada por meio do grupo de exemplos da base de dados MNIST, em que o melhor desempenho foi registrado no valor 97.5% e 99% para o modelo de rede multi-camada e convolucional respectivamente. O sistema completo também foi validado em um grupo de exemplos criado à mão, em que o melhor desempenho teve acurácia de 90%.
Abstract: Big advancements have been happening on modern computing hardware within the last decades. Year after year processors and electronic devices have been rising their speed and capabilities, all of this at an exponencial level. This rising on processing power accelerates the execution of complex algorithms from the machine learning field, and this enables their use in new fields of robotics, surveillance and healthcare. Besides all stated about processors, the introduction and wide adoption of mobile devices, or smartphones, contributed the decrease in costs and improvements on accessibility to high quality video recording technology. In this scenario, there has been a surge in studies about computer vision and its applications under these conditions. Text detection is a complex problem related to computer vision, and solutions to it could enable interesting applications such as photo optical character recognition on printed documents as well as new ways to automate processes in robotics. This work presents a system for detecting and recognizing numbers, both written and printed. Number detection was implemented by making use of computer vision techniques like cascade classifiers, image pyramids, the sliding window method along with manual feature generation method “Haar”. Number recognition was done by training two different machine learning classifiers, a multi-layer neural network and a convolutional neural network. The digit detection system was validated with a group of hand crafted examples. A confusion matrix was extracted from the detector’s performance on the set and its f1 score was calculated, achieving a maximum value of 0.4194. Classification was validated by making use of the MNIST dataset, on which each classifier’s accuracy was registered, reaching a maximum of 97.5% for the multi-layer neural net and 99% for the convolutional model. Validation for the system as a whole was also performed by making use of a hand crafted dataset, to which the system achieved a best accuracy of 90%.
Informações adicionais: Trabalho de Conclusão Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia Elétrica



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.