Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/21060
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2018_HugoLuisAndradeSilva_tcc.pdf78,39 MBAdobe PDFver/abrir
Título: Criação automática de datasets e treinamento de classificadores sob demanda a partir de web crawling e deep learning
Autor(es): Silva, Hugo Luís Andrade
Orientador(es): Lamar, Marcus Vinicius
Assunto: Aprendizado do computador
Visão por computador
Reconhecimento de padrões
Data de apresentação: 8-Ago-2018
Data de publicação: 20-Nov-2018
Referência: SILVA, Hugo Luís Andrade. Criação automática de datasets e treinamento de classificadores sob demanda a partir de web crawling e deep learning. 2018. 119 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2018.
Resumo: Aplicações de Machine Learning da maneira como são feitas hoje comumente requerem coleta de dados manual, que pode demorar para ser feita e, por isso, limita aplicações que requerem conjuntos de dados grandes. O trabalho trata do projeto de uma aplicação web onde o usuário terá as possibilidades de criar, armazenar e carregar detectores de objetos e datasets de maneira automática, removendo a necessidade de coletar manualmente as imagens. A criação é feita dinamicamente, de forma que os datasets utilizados no treinamento serão criados de maneira on demand fazendo uso de web crawling, tirando assim a restrição de se utilizar datasets prontos, que nem sempre são encontrados para aplicações específicas. Em seguida, são realizados testes relativos aos subsistemas de Inteligência Artificial envolvidos em cada etapa do projeto descrito e a viabilidade da criação de uma aplicação desse tipo é analisada, tendo em vista os resultados dos experimentos supracitados. O projeto consiste em dois passos principais: remoção de imagens ruidosas e treinamento de classificadores com as restantes. Os métodos propostos atingiram 94.4% no primeiro passo e 98.98% no segundo usando imagens obtidas usando classes do CIFAR-10 como queries.
Abstract: Current Machine Learning applications usually require manual data collection, which take long to complete and thus may limit applications which require large datasets. This project designs a web application where the user will have the possibilities of creating, storing and loading object detectors and datasets automatically, removing the need to manually collect images. Creation is done dinamically, and the datasets used are created on demand using web crawling, removing the restriction of having to utilize already existing datasets, which may not exist for speciffic applications. Next, Artificial Intelligence subsystems present on each step of the described project are tested and the viability of creating such a web application is analyzed in light of the results of the above mentioned experiments. The project is consists of two main steps: removing noisy images and training classifiers with the rest. The proposed methods achieved 94.4% on the first step and 98.98% on the second one on images downloaded using CIFAR-10 classes as queries.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018.
Aparece na Coleção:Engenharia da Computação



Este item está licenciado na Licença Creative Commons Creative Commons