Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/29881
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_MatheusOliveiraBraga_tcc.pdfTrabalho de conclusão de curso774,73 kBAdobe PDFver/abrir
Título: Uma avaliação elaborada dos principais modelos de referência para classificação de imagens
Autor(es): Braga, Matheus Oliveira
Orientador(es): Queiroz, Ricardo Lopes de
Assunto: Reconhecimento de padrões
Redes neurais (Computação)
Visão por computador
Data de apresentação: 20-Mai-2021
Data de publicação: 11-Fev-2022
Referência: BRAGA, Matheus Oliveira. Uma avaliação elaborada dos principais modelos de referência para classificação de imagens. 2021. 45 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia da Computação) — Universidade de Brasília, Brasília, 2021.
Resumo: Ultimamente, a área da aprendizagem profunda vem sendo um objeto de pesquisa muito comum no campo da visão computacional. Por conta deste interesse de desenvolvimento na área, uma vasta gama de modelos de redes neurais propostos para classificação e recon hecimento de imagens e objetos vem surgindo, cada um com suas qualidades e defeitos. Consequentemente, pesquisadores que desejam apenas usufruir de tais modelos para auxil iar em suas pesquisas de áreas semelhantes, acabam necessitando se aprofundar no assunto apenas para poder decidir quais modelos melhor se encaixariam em seus trabalhos. Este trabalho consiste em fazer uma análise comparativa dos principais modelos de referência para reconhecimento de imagens e detecção de objetos. O foco principal é con seguir apontar quais modelos se sobressaem em aspectos de precisão e tempo de execução, para que se possa obter uma noção de quais são indicados para certos tipos de situações. Por exemplo, uma boa precisão com um modelo mais leve, para máquinas menos robustas, ou a melhor eficiência possível, descartando a preocupação com a utilização de recursos. Para tal, cada um dos modelos apresentados neste trabalho foi avaliado dentro do mesmo ambiente de software e hardware, e utilizando as mesmas bases de dados, sendo um deles composto por 50000 imagens do banco de dados da ImageNet, comumente utilizado em desafios de reconhecimento de imagens, e o outro, um banco composto por 100 imagens coletadas pelo autor deste trabalho. Os resultados mostraram que o Inception-V3, DenseNet e ResNet, empregaram as melhores estratégias para precisão na classificação, enquanto o ShuffleNet-V2 mostrou ser o modelo mais econômico.
Abstract: Deep learning has been a common object of research in computer vision. Because of this large interest, a considerable amount of neural network models for classification and recognition of images and objects have been appearing, each with their own strengths and weaknesses. Consequently, researchers that wish to simply use these models as aid to their work in similar areas end up having to hard commit to studying these concepts just for the simplicity of deciding which models are best suited to develop their research. This work consists in an analysis and comparison of the most well known resource models for image recognition and object detection. The main goal is to appoint which model better performs in aspects such as accuracy and execution time, to have a notion of which are suited for certain situations. For example, a less resource consuming model with decent accuracy for less powerful machines, or maybe, the best efficiency without any concern regarding resource consumption. With that in mind, each one of the models presented in this work have been evaluated on the same software and hardware environments, and with the same datasets, one of them being the well known Imagenet set database, which includes 50000 images, commonly used in image recognition challenges, and the other one being a dataset built by the author of this document himself, containing 100 pieces. The results display that Inception-V3, DenseNet and ResNet applied the best strate gies for precision, while ShuffleNet-V2 was the most economic model.
Informações adicionais: Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.