Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39739

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2023_FranciscoHenriqueCosta_IsabelaCruzeiro_tcc.pdf		3,34 MB	Adobe PDF	ver/abrir

Título:	Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers
Autor(es):	Costa, Francisco Henrique da Silva Cruzeiro, Isabela Maria Pereira
Orientador(es):	Vidal, Flávio de Barros
Assunto:	Processamento de linguagem natural (Computação) Semântica
Data de apresentação:	14-Dez-2023
Data de publicação:	29-Ago-2024
Referência:	COSTA, Francisco Henrique da Silva; CRUZEIRO, Isabela Maria Pereira. Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers. 2023. 70 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Mecatrônica) — Universidade de Brasília, Brasília, 2023.
Resumo:	A comunicação oficial do país é conduzida por meio de diários oficiais, que apresenta grande volume de publicações em formato textual, neste ambiente existe o problema das fraudes em licitações públicas que gera prejuízos aos cofres públicos e danos à sociedade. A identificação de práticas corruptivas em documentos publicados nesse meio é desafiadora em termos de acesso e organização. Nesse sentido, o trabalho proposto visa desenvolver metodologias para a extração e organização de informações presentes nos diários oficiais, fornecendo suporte aos tomadores de decisão no combate à corrupção e fraudes em instrumentos contratuais publicados na Seção 3 do Diário Oficial da União. Por meio de técnicas de processamento de linguagem natural com Transformers, é esperado que seja possível definir o relacionamento semântico entre entidades contratuais que exigem publicação, para facilitar a visualização de documentos correlacionados para o especialistas. Um conjunto de dados foi criado com publicações da Seção 3 do DOU para avaliar a semelhança entre publicações de um mesmo convênio. Realizou-se um levantamento bibliográfico e definição de tarefas, como Passage Ranking e Semantic Textual Similarity, que fundamentaram o estudo. Por meio dos métodos adotados, foram conduzidas análises e estudos de Sentence-Transformers para a seleção do modelo a ser treinado. Os resultados indicam que o modelo treinado alcançou uma acurácia de 96%, representando um avanço em relação ao modelo pré-treinado. No entanto, a precisão, a sensibilidade e o F1-score não demonstraram melhoria no desempenho.
Informações adicionais:	Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2023.
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:	Engenharia Mecatrônica

Mostrar item em formato completo Recomendar este item Visualizar estatísticas