Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Borges, Vinícius Ruela Pereira | - |
dc.contributor.author | Neves, Felipe Oliveira Magno | - |
dc.identifier.citation | NEVES, Felipe Oliveira Magno. Aumento de dados via redes adversariais generativas para classificação de imagens em conjuntos de dados desbalanceados. 2024. 92 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2024. | pt_BR |
dc.description | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024. | pt_BR |
dc.description.abstract | A classificação de imagens é a tarefa na qual um sistema deve categorizar imagens
com base nas suas propriedades visuais, ou seus objetos constituintes, de acordo com
classes pré-definidas. Esta tarefa é extensivamente aplicada em diversos domínios do
conhecimento, como na área médica, de segurança pública e em manufatura. A acurácia
e, subsequentemente, a utilidade destes modelos de aprendizado de máquina depende
diretamente da qualidade dos dados utilizados para seu treinamento. O desbalanceamento
de classes no conjunto de dados é um aspecto que pode afetar o desempenho dos modelos
de classificação, podendo ocorrer por diversos motivos, como a dificuldade de obtenção de
dados, ou a maior raridade de ocorrência de uma das classes do conjunto. O impacto do
desbalanceamento de classes pode ser atenuado ao se utilizar aumento de dados, prática
na qual, tradicionalmente, são feitas aleatoriamente transformações como a adição de
ruído e rotação das imagens ao lê-las do conjunto de dados.
Os modelos generativos são capazes de gerar novos dados similares aos utilizados para
seu treinamento, e seu uso em imagens tem ganhado popularidade. Sua aplicação inicial
consistiu primariamente em fins artísticos, como aprimoramento de imagens e design
de produtos. Recentemente, percebeu-se que esta classe de modelos apresenta grande
potencial para a tarefa de aumento de dados, visto que podem gerar novos dados sem
introduzir características que antes não estavam presentes nas imagens.
Este estudo se propõe a avaliar os benefícios trazidos pelo uso de redes generativas
adversariais para o aumento de dados para tarefas de classificação de imagens, com
enfoque em conjuntos de dados desbalanceados. Para alcançar este objetivo, foi proposta
uma metodologia de comparação do desempenho de modelos generativos para aumento
de dados. Além disso, foi proposta uma arquitetura baseada em redes adversariais
generativas (denominada WUCGAN). Nela é utilizado um gerador que recebe uma
imagem do conjunto de dados e tem o objetivo de modificá-la realisticamente, e um
discriminador que recebe uma imagem e deve classificá-la como real ou gerada, assim
como definir sua classe, permitindo o uso de aprendizado residual tanto no gerador quanto
no discriminador. Os modelos generativos foram avaliados utilizando-se os conjuntos de
dados MNIST, CIFAR-10, Plant Village e Eurosat, e os resultados obtidos indicam ser possível obter melhoria nas métricas F1-Macro e AUROC de classificadores em até 0,32
e 0,125 respectivamente. O código-fonte da implementação feita e os resultados o podem
ser acessados no repositório do github. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Redes geradoras adversárias | pt_BR |
dc.subject.keyword | Imagens digitais | pt_BR |
dc.subject.keyword | Imagens - análise | pt_BR |
dc.title | Aumento de dados via redes adversariais generativas para classificação de imagens em conjuntos de dados desbalanceados | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2024-08-22T11:48:59Z | - |
dc.date.available | 2024-08-22T11:48:59Z | - |
dc.date.submitted | 2024-01-30 | - |
dc.identifier.uri | https://bdm.unb.br/handle/10483/39634 | - |
dc.language.iso | Português | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. | pt_BR |
Aparece na Coleção: | Ciência da Computação
|