Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/21060
Título: | Criação automática de datasets e treinamento de classificadores sob demanda a partir de web crawling e deep learning |
Autor(es): | Silva, Hugo Luís Andrade |
Orientador(es): | Lamar, Marcus Vinicius |
Assunto: | Aprendizado do computador Visão por computador Reconhecimento de padrões |
Data de apresentação: | 8-Ago-2018 |
Data de publicação: | 20-Nov-2018 |
Referência: | SILVA, Hugo Luís Andrade. Criação automática de datasets e treinamento de classificadores sob demanda a partir de web crawling e deep learning. 2018. 119 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2018. |
Resumo: | Aplicações de Machine Learning da maneira como são feitas hoje comumente requerem
coleta de dados manual, que pode demorar para ser feita e, por isso, limita aplicações
que requerem conjuntos de dados grandes. O trabalho trata do projeto de uma aplicação
web onde o usuário terá as possibilidades de criar, armazenar e carregar detectores de
objetos e datasets de maneira automática, removendo a necessidade de coletar manualmente
as imagens. A criação é feita dinamicamente, de forma que os datasets utilizados
no treinamento serão criados de maneira on demand fazendo uso de web crawling, tirando
assim a restrição de se utilizar datasets prontos, que nem sempre são encontrados para
aplicações específicas. Em seguida, são realizados testes relativos aos subsistemas de Inteligência
Artificial envolvidos em cada etapa do projeto descrito e a viabilidade da criação
de uma aplicação desse tipo é analisada, tendo em vista os resultados dos experimentos
supracitados. O projeto consiste em dois passos principais: remoção de imagens ruidosas
e treinamento de classificadores com as restantes. Os métodos propostos atingiram
94.4% no primeiro passo e 98.98% no segundo usando imagens obtidas usando classes do
CIFAR-10 como queries. |
Abstract: | Current Machine Learning applications usually require manual data collection, which take
long to complete and thus may limit applications which require large datasets. This project
designs a web application where the user will have the possibilities of creating, storing and
loading object detectors and datasets automatically, removing the need to manually collect
images. Creation is done dinamically, and the datasets used are created on demand using
web crawling, removing the restriction of having to utilize already existing datasets, which
may not exist for speciffic applications. Next, Artificial Intelligence subsystems present
on each step of the described project are tested and the viability of creating such a web
application is analyzed in light of the results of the above mentioned experiments. The
project is consists of two main steps: removing noisy images and training classifiers with
the rest. The proposed methods achieved 94.4% on the first step and 98.98% on the second
one on images downloaded using CIFAR-10 classes as queries. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018. |
Aparece na Coleção: | Engenharia da Computação
|
Este item está licenciado na Licença Creative Commons