Título: | Construção de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadas |
Autor(es): | Rodrigues, Matheus Gabriel Alves |
Orientador(es): | Braz, Fabricio Ataides |
Assunto: | Aprendizagem de máquina Processamento de linguagem natural (Computação) Reconhecimento de entidade nomeada Aprendizagem ativa |
Data de apresentação: | 24-Jul-2023 |
Data de publicação: | 22-Nov-2023 |
Referência: | RODRIGUES, Matheus Gabriel Alves. Construção de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadas. 2023. 50 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2023. |
Resumo: | Com a crescente demanda por aplicações que fazem o uso de modelos de inteligência artificial, o custo envolvido na construção de um modelo tem sido uma preocupação constante, dentre as etapas que mais encarecem um modelo está a de rotulação dos dados que serão utilizados para treinamento. Uma das soluções existentes para este problema é o uso de uma abordagem conhecida como aprendizagem ativa, que consiste em permitir que durante o período de treinamento de um ou mais modelos, ocorra uma interação dos mesmo com um humano especialista no assunto dos dados, de modo que este consiga realizar validações em apenas alguns dados previamente selecionados. O objetivo deste trabalho é desenvolver uma pipeline de active learning focada em modelos que fazem a atividade de reconhecimento de entidades nomeadas. Foram coletados dados abertos que permitiram a criação de um fluxo por completo, também foi selecionada uma ferramenta de rotulação que possibilita a interação dos oráculos com os dados selecionados a cada etapa do fluxo. A pipeline elaborada foi experimentada para a construção de um modelo de classificação binária de dados textuais, isso possibilitou verificar que o fluxo funciona corretamente e levantar possíveis melhorias para serem elaboradas no decorrer da continuação dessa pesquisa. |
Abstract: | The increasing demand for applications that use artificial intelligence models has madethe cost involved in building a model a constant concern. One of the stages that most increase the cost of a model is the labeling of the data to be used for training. One of the solutions to this problem is the use of an approach known as active learning, which consists of allowing the models to interact with a human expert in the subject of the data during the training period, so that the expert can validate data in only a few previously selected data. The objective of this work is to develop an active learning pipeline focused on models that perform named entity recognition. Open data was collected to create a complete flow, anda labeling tool was selected that allows the oracles to interact with the selected data at each stage of the flow. The pipeline developed was tested for building a binary classification model of textual data, which allowed us to verify that the flow works correctly and to raise possible improvements to be developed in the continuation of this research. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, Engenharia de Software, 2023. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia de Software
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.