Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39634
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2024_FelipeOliveiraMagnoNeves_tcc.pdf165,63 MBAdobe PDFver/abrir
Título: Aumento de dados via redes adversariais generativas para classificação de imagens em conjuntos de dados desbalanceados
Autor(es): Neves, Felipe Oliveira Magno
Orientador(es): Borges, Vinícius Ruela Pereira
Assunto: Redes geradoras adversárias
Imagens digitais
Imagens - análise
Data de apresentação: 30-Jan-2024
Data de publicação: 22-Ago-2024
Referência: NEVES, Felipe Oliveira Magno. Aumento de dados via redes adversariais generativas para classificação de imagens em conjuntos de dados desbalanceados. 2024. 92 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2024.
Resumo: A classificação de imagens é a tarefa na qual um sistema deve categorizar imagens com base nas suas propriedades visuais, ou seus objetos constituintes, de acordo com classes pré-definidas. Esta tarefa é extensivamente aplicada em diversos domínios do conhecimento, como na área médica, de segurança pública e em manufatura. A acurácia e, subsequentemente, a utilidade destes modelos de aprendizado de máquina depende diretamente da qualidade dos dados utilizados para seu treinamento. O desbalanceamento de classes no conjunto de dados é um aspecto que pode afetar o desempenho dos modelos de classificação, podendo ocorrer por diversos motivos, como a dificuldade de obtenção de dados, ou a maior raridade de ocorrência de uma das classes do conjunto. O impacto do desbalanceamento de classes pode ser atenuado ao se utilizar aumento de dados, prática na qual, tradicionalmente, são feitas aleatoriamente transformações como a adição de ruído e rotação das imagens ao lê-las do conjunto de dados. Os modelos generativos são capazes de gerar novos dados similares aos utilizados para seu treinamento, e seu uso em imagens tem ganhado popularidade. Sua aplicação inicial consistiu primariamente em fins artísticos, como aprimoramento de imagens e design de produtos. Recentemente, percebeu-se que esta classe de modelos apresenta grande potencial para a tarefa de aumento de dados, visto que podem gerar novos dados sem introduzir características que antes não estavam presentes nas imagens. Este estudo se propõe a avaliar os benefícios trazidos pelo uso de redes generativas adversariais para o aumento de dados para tarefas de classificação de imagens, com enfoque em conjuntos de dados desbalanceados. Para alcançar este objetivo, foi proposta uma metodologia de comparação do desempenho de modelos generativos para aumento de dados. Além disso, foi proposta uma arquitetura baseada em redes adversariais generativas (denominada WUCGAN). Nela é utilizado um gerador que recebe uma imagem do conjunto de dados e tem o objetivo de modificá-la realisticamente, e um discriminador que recebe uma imagem e deve classificá-la como real ou gerada, assim como definir sua classe, permitindo o uso de aprendizado residual tanto no gerador quanto no discriminador. Os modelos generativos foram avaliados utilizando-se os conjuntos de dados MNIST, CIFAR-10, Plant Village e Eurosat, e os resultados obtidos indicam ser possível obter melhoria nas métricas F1-Macro e AUROC de classificadores em até 0,32 e 0,125 respectivamente. O código-fonte da implementação feita e os resultados o podem ser acessados no repositório do github.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.