Construção de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadas

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/36835

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2023_MatheusGabrielAlvesRodrigues_tcc.pdf		1,56 MB	Adobe PDF	ver/abrir

Registro completo

Campo Dublin Core	Valor	Língua
dc.contributor.advisor	Braz, Fabricio Ataides	-
dc.contributor.author	Rodrigues, Matheus Gabriel Alves	-
dc.identifier.citation	RODRIGUES, Matheus Gabriel Alves. Construção de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadas. 2023. 50 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2023.	pt_BR
dc.description	Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, Engenharia de Software, 2023.	pt_BR
dc.description.abstract	Com a crescente demanda por aplicações que fazem o uso de modelos de inteligência artificial, o custo envolvido na construção de um modelo tem sido uma preocupação constante, dentre as etapas que mais encarecem um modelo está a de rotulação dos dados que serão utilizados para treinamento. Uma das soluções existentes para este problema é o uso de uma abordagem conhecida como aprendizagem ativa, que consiste em permitir que durante o período de treinamento de um ou mais modelos, ocorra uma interação dos mesmo com um humano especialista no assunto dos dados, de modo que este consiga realizar validações em apenas alguns dados previamente selecionados. O objetivo deste trabalho é desenvolver uma pipeline de active learning focada em modelos que fazem a atividade de reconhecimento de entidades nomeadas. Foram coletados dados abertos que permitiram a criação de um fluxo por completo, também foi selecionada uma ferramenta de rotulação que possibilita a interação dos oráculos com os dados selecionados a cada etapa do fluxo. A pipeline elaborada foi experimentada para a construção de um modelo de classificação binária de dados textuais, isso possibilitou verificar que o fluxo funciona corretamente e levantar possíveis melhorias para serem elaboradas no decorrer da continuação dessa pesquisa.	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject.keyword	Aprendizagem de máquina	pt_BR
dc.subject.keyword	Processamento de linguagem natural (Computação)	pt_BR
dc.subject.keyword	Reconhecimento de entidade nomeada	pt_BR
dc.subject.keyword	Aprendizagem ativa	pt_BR
dc.title	Construção de uma pipeline de aprendizagem ativa para modelos de reconhecimento de entidades nomeadas	pt_BR
dc.type	Trabalho de Conclusão de Curso - Graduação - Bacharelado	pt_BR
dc.date.accessioned	2023-11-22T21:08:15Z	-
dc.date.available	2023-11-22T21:08:15Z	-
dc.date.submitted	2023-07-24	-
dc.identifier.uri	https://bdm.unb.br/handle/10483/36835	-
dc.language.iso	Português	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.	pt_BR
dc.description.abstract1	The increasing demand for applications that use artificial intelligence models has madethe cost involved in building a model a constant concern. One of the stages that most increase the cost of a model is the labeling of the data to be used for training. One of the solutions to this problem is the use of an approach known as active learning, which consists of allowing the models to interact with a human expert in the subject of the data during the training period, so that the expert can validate data in only a few previously selected data. The objective of this work is to develop an active learning pipeline focused on models that perform named entity recognition. Open data was collected to create a complete flow, anda labeling tool was selected that allows the oracles to interact with the selected data at each stage of the flow. The pipeline developed was tested for building a binary classification model of textual data, which allowed us to verify that the flow works correctly and to raise possible improvements to be developed in the continuation of this research.	pt_BR
Aparece na Coleção:	Engenharia de Software

Mostrar item em formato simples Recomendar este item Visualizar estatísticas