Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/36835
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2023_MatheusGabrielAlvesRodrigues_tcc.pdf1,56 MBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorBraz, Fabricio Ataídes-
dc.contributor.authorRodrigues, Matheus Gabriel Alves-
dc.identifier.citationRODRIGUES, Matheus Gabriel Alves. Construção de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadas. 2023. 50 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2023.pt_BR
dc.descriptionTrabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, Engenharia de Software, 2023.pt_BR
dc.description.abstractCom a crescente demanda por aplicações que fazem o uso de modelos de inteligência artificial, o custo envolvido na construção de um modelo tem sido uma preocupação constante, dentre as etapas que mais encarecem um modelo está a de rotulação dos dados que serão utilizados para treinamento. Uma das soluções existentes para este problema é o uso de uma abordagem conhecida como aprendizagem ativa, que consiste em permitir que durante o período de treinamento de um ou mais modelos, ocorra uma interação dos mesmo com um humano especialista no assunto dos dados, de modo que este consiga realizar validações em apenas alguns dados previamente selecionados. O objetivo deste trabalho é desenvolver uma pipeline de active learning focada em modelos que fazem a atividade de reconhecimento de entidades nomeadas. Foram coletados dados abertos que permitiram a criação de um fluxo por completo, também foi selecionada uma ferramenta de rotulação que possibilita a interação dos oráculos com os dados selecionados a cada etapa do fluxo. A pipeline elaborada foi experimentada para a construção de um modelo de classificação binária de dados textuais, isso possibilitou verificar que o fluxo funciona corretamente e levantar possíveis melhorias para serem elaboradas no decorrer da continuação dessa pesquisa.pt_BR
dc.rightsAcesso Abertopt_BR
dc.subject.keywordAprendizagem de máquinapt_BR
dc.subject.keywordProcessamento de linguagem natural (Computação)pt_BR
dc.subject.keywordReconhecimento de entidade nomeadapt_BR
dc.subject.keywordAprendizagem ativapt_BR
dc.titleConstrução de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadaspt_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2023-11-22T21:08:15Z-
dc.date.available2023-11-22T21:08:15Z-
dc.date.submitted2023-07-24-
dc.identifier.urihttps://bdm.unb.br/handle/10483/36835-
dc.language.isoPortuguêspt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.description.abstract1The increasing demand for applications that use artificial intelligence models has madethe cost involved in building a model a constant concern. One of the stages that most increase the cost of a model is the labeling of the data to be used for training. One of the solutions to this problem is the use of an approach known as active learning, which consists of allowing the models to interact with a human expert in the subject of the data during the training period, so that the expert can validate data in only a few previously selected data. The objective of this work is to develop an active learning pipeline focused on models that perform named entity recognition. Open data was collected to create a complete flow, anda labeling tool was selected that allows the oracles to interact with the selected data at each stage of the flow. The pipeline developed was tested for building a binary classification model of textual data, which allowed us to verify that the flow works correctly and to raise possible improvements to be developed in the continuation of this research.pt_BR
Aparece na Coleção:Engenharia de Software



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.