Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/39739
Título: | Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers |
Autor(es): | Costa, Francisco Henrique da Silva Cruzeiro, Isabela Maria Pereira |
Orientador(es): | Vidal, Flávio de Barros |
Assunto: | Processamento de linguagem natural (Computação) Semântica |
Data de apresentação: | 14-Dez-2023 |
Data de publicação: | 29-Ago-2024 |
Referência: | COSTA, Francisco Henrique da Silva; CRUZEIRO, Isabela Maria Pereira. Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers. 2023. 70 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Mecatrônica) — Universidade de Brasília, Brasília, 2023. |
Resumo: | A comunicação oficial do país é conduzida por meio de diários oficiais, que apresenta grande
volume de publicações em formato textual, neste ambiente existe o problema das fraudes em
licitações públicas que gera prejuízos aos cofres públicos e danos à sociedade. A identificação
de práticas corruptivas em documentos publicados nesse meio é desafiadora em termos de
acesso e organização. Nesse sentido, o trabalho proposto visa desenvolver metodologias para
a extração e organização de informações presentes nos diários oficiais, fornecendo suporte
aos tomadores de decisão no combate à corrupção e fraudes em instrumentos contratuais
publicados na Seção 3 do Diário Oficial da União. Por meio de técnicas de processamento de
linguagem natural com Transformers, é esperado que seja possível definir o relacionamento
semântico entre entidades contratuais que exigem publicação, para facilitar a visualização
de documentos correlacionados para o especialistas. Um conjunto de dados foi criado com
publicações da Seção 3 do DOU para avaliar a semelhança entre publicações de um mesmo
convênio. Realizou-se um levantamento bibliográfico e definição de tarefas, como Passage
Ranking e Semantic Textual Similarity, que fundamentaram o estudo. Por meio dos métodos
adotados, foram conduzidas análises e estudos de Sentence-Transformers para a seleção do
modelo a ser treinado. Os resultados indicam que o modelo treinado alcançou uma acurácia
de 96%, representando um avanço em relação ao modelo pré-treinado. No entanto, a precisão,
a sensibilidade e o F1-score não demonstraram melhoria no desempenho. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2023. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia Mecatrônica
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.