Título: | Estudo comparativo de redes neurais convolucionais para a classificação da qualidade de imagens de documentos de identidade |
Autor(es): | Almeida, Leonardo de Borges, Marcus Vinícius da Silva |
Orientador(es): | Oliveira, Roberta Barbosa |
Assunto: | Redes neurais (Computação) Imagens - leitura Identificação facial Aprendizado de máquina |
Data de apresentação: | 26-Mai-2021 |
Data de publicação: | 23-Jun-2022 |
Referência: | ALMEIDA, Leonardo de; BORGES, Marcus Vinícius da Silva. Estudo comparativo de redes neurais convolucionais para a classificação da qualidade de imagens de documentos de identidade. 2021. xii, 44 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2021. |
Resumo: | O uso de documentos de identidade como Registro Geral e Carteira Nacional de Habilitação é uma das formas de verificação de clientes em sistemas onlines como bancos e e-commerces. Nesses sistemas, uma imagem do documento é enviada para que possa ser feita a identificação do cliente. Devido à grande quantidade de dispositivos que podem capturar essas imagens, um desafio existente é saber se a qualidade da imagem submetida está boa ou não. Uma das possíveis técnicas que podem ser utilizadas para fazer a classificação dessa imagem quanto a sua qualidade é a de Redes Neurais Convolucionais devido a capacidade de extração automática de características. Nesse sentido, o presente trabalho apresenta um estudo comparativo do desempenho de algumas arquiteturas de redes neurais convolucionais, tais como, ResNet50, VGG16, Xception, DenseNet e MobileNet, na classificação da qualidade das imagens de documentos de identificação. Nos experimentos que foram realizados, as arquiteturas foram combinadas com as técnicas de Transfer Learning, Dropout, Data Augmentation e Fine-Tuning e as métricas de acurácia, revocação, precisão, F1-Score e tempo médio de classificação, foram utilizadas para fazer as comparações. As arquiteturas que apresentaram os melhores resultados foram a ResNet50, DenseNet e Xception. Por fim, é possível concluir que as arquiteturas VGG16 e Xception apresentaram melhora nos resultados com a adição das técnicas de Dropout,
Data Augmentation e Fine-Tuning enquanto a arquitetura ResNet50 apresentou queda no desempenho com a adição das mesmas técnicas. |
Abstract: | The use of identity documents such as Registro Geral and Carteira Nacional de Habilitação is one of the ways to verify customers in online systems such as banks and e-commerce. In these systems, an image of the document is sent so that the customer’s identification can be made. Due to the large number of devices that can capture these images, an existing challenge is whether the quality of the submitted image is good or not. One of
the possible techniques that can be used to classify this image according to its quality is Convolutional Neural Networks. In this sense, the present work describes a compar ative study of the performance of the architectures ResNet, VGG, Xception, DenseNet and MobileNet in the classification of the quality of images of identification documents. In the experiments that were carried out, the architectures were combined with Transfer Learning, Dropout, Data Augmentation and Fine-Tuning techniques and the metrics of accuracy, recall, precision, F1-Score and average time of evaluation of the test dataset, were used to make the comparisons. Finally, it’s possible to conclude that the VGG16 and Xception architectures superior in results with the addition of Dropout, Data Aug mentation and Fine-Tuning techniques, while the ResNet50 architecture presented a drop
in performance with the addition of the techniques. |
Informações adicionais: | Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.