Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/31239
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_AntonioRodrigues_TiagoCabral_tcc.pdf8,06 MBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorGarcia, Luís Paulo Faina-
dc.contributor.authorCabral, Tiago Rodrigues da Cunha-
dc.contributor.authorRodrigues, Antônio Henrique de Moura-
dc.identifier.citationCABRAL, Tiago R. C.; RODRIGUES, Antônio H. M. Estratégias de aprendizado ativo baseado em medidas de complexidade. 2021. xiii, 44 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2021.pt_BR
dc.descriptionTrabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021.pt_BR
dc.description.abstractAprendizado Ativo é uma área do Aprendizado de Máquina que visa diminuir a interação humana no processo de rotulação de uma base de dados, permitindo que estratégias de seleção escolham quais amostras deverão ser rotuladas e utilizadas em seu treino. Através de consultas à base, um subconjunto de amostras rotuladas é criado, formado por instâncias mais informativas e que caracterizem melhor o problema em si. O treino do modelo com essas amostras pode ter um desempenho preditivo tão bom como quando utilizada toda a base. Os espaços de busca dessas amostras são definidos por meio de cenários e estratégias específicas [1]. No entanto, as estratégias de Aprendizado Ativo existentes não avaliam a complexidade do problema em si, fato que pode limitar o desempenho de um modelo de classificação. Para contornar isso, estudos sobre análise de complexidade em nível de base de dados contribuem na categorização de um problema e reduzem o erro sistemático de modelo causado por amostras muito complexas. Nesse contexto, o estudo de medidas de complexidade é bastante relevante para aumentar a compreensão acerca do domínio de problemas. Ademais, utilizar medidas de complexidade decompostas em nível de instância pode apoiar análises mais refinadas sobre cada amostra de um conjunto de dados, possibilitando assim uma estimativa do impacto de uma instância no aprendizado de um modelo. Com isso, esse trabalho propõe e avalia estratégias de amostragem de Aprendizado Ativo com medidas de complexidade adaptadas como critério de seleção de amostras. Para tal, foi realizado um experimento que avaliou o resultado tanto de estratégias clássicas quanto das estratégias propostas. Para isso, utilizou dados de 71 bases de classificação de propósito geral, além de avaliar o desempenho dos modelos baseados em 4 diferentes algoritmos de classificação. Foram feitas análises acerca dos resultados coletados, tanto de desempenho médio quanto do desempenho por porcentagem de amostras utilizadas no treino. Os resultados foram promissores ao mostrarem que os modelos das estratégias propostas tiveram bons ganhos de desempenho utilizando amostragens geradas pelos critérios baseados em medidas de complexidade avaliadas em nível de instância.pt_BR
dc.rightsAcesso Abertopt_BR
dc.subject.keywordInteligência artificialpt_BR
dc.subject.keywordAprendizado de máquinapt_BR
dc.subject.keywordAprendizado ativopt_BR
dc.titleEstratégias de aprendizado ativo baseado em medidas de complexidadept_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2022-06-27T22:54:24Z-
dc.date.available2022-06-27T22:54:24Z-
dc.date.submitted2021-11-04-
dc.identifier.urihttps://bdm.unb.br/handle/10483/31239-
dc.language.isoPortuguêspt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.description.abstract1Active Learning is an area of Machine Learning that focus on reducing human interaction in the database's labeling process, allowing query strategies to choose which samples should be labeled and used in their training. Through base queries, a labeled subset is created, compound by more informative instances (i.e. instances that better characterize the problem itself). Training the model with these samples can have such good predictive performance when compared to models that use the entire base. The search spaces for these samples are defined through specific [1] scenarios and strategies. However, the existing Active Learning strategies do not assess the complexity of the problem itself, which can limit the performance of a classification model. To get around this, studies on complexity analysis at the database level contribute to the categorization of a problem and reduce the systematic model error caused by very complex samples. In this context, the study of complexity measures is very relevant to increase the understanding of the problem domain. Furthermore, using instance-level decomposed complexity measures can support more refined analysis on each sample of a dataset, thus enabling an estimate of the impact of an instance on model learning. Thus, this work proposes and evaluates Active Learning sampling strategies with adapted complexity measures as sample querying criteria. To this end, an experiment was carried out that evaluated the results of both classical and proposed strategies. For this, it used data from 71 general purpose classification bases, in addition to evaluating the performance of models based on 4 different classification algorithms. Analyzes were performed on the results collected, both average performance and performance by percentage of samples used in training. The results were promising in showing that the models of the proposed strategies had good performance gains using samples generated by criteria based on complexity measures evaluated at the instance level.pt_BR
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.