Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39739
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2023_FranciscoHenriqueCosta_IsabelaCruzeiro_tcc.pdf3,34 MBAdobe PDFver/abrir
Título: Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers
Autor(es): Costa, Francisco Henrique da Silva
Cruzeiro, Isabela Maria Pereira
Orientador(es): Vidal, Flávio de Barros
Assunto: Processamento de linguagem natural (Computação)
Semântica
Data de apresentação: 14-Dez-2023
Data de publicação: 29-Ago-2024
Referência: COSTA, Francisco Henrique da Silva; CRUZEIRO, Isabela Maria Pereira. Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers. 2023. 70 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Mecatrônica) — Universidade de Brasília, Brasília, 2023.
Resumo: A comunicação oficial do país é conduzida por meio de diários oficiais, que apresenta grande volume de publicações em formato textual, neste ambiente existe o problema das fraudes em licitações públicas que gera prejuízos aos cofres públicos e danos à sociedade. A identificação de práticas corruptivas em documentos publicados nesse meio é desafiadora em termos de acesso e organização. Nesse sentido, o trabalho proposto visa desenvolver metodologias para a extração e organização de informações presentes nos diários oficiais, fornecendo suporte aos tomadores de decisão no combate à corrupção e fraudes em instrumentos contratuais publicados na Seção 3 do Diário Oficial da União. Por meio de técnicas de processamento de linguagem natural com Transformers, é esperado que seja possível definir o relacionamento semântico entre entidades contratuais que exigem publicação, para facilitar a visualização de documentos correlacionados para o especialistas. Um conjunto de dados foi criado com publicações da Seção 3 do DOU para avaliar a semelhança entre publicações de um mesmo convênio. Realizou-se um levantamento bibliográfico e definição de tarefas, como Passage Ranking e Semantic Textual Similarity, que fundamentaram o estudo. Por meio dos métodos adotados, foram conduzidas análises e estudos de Sentence-Transformers para a seleção do modelo a ser treinado. Os resultados indicam que o modelo treinado alcançou uma acurácia de 96%, representando um avanço em relação ao modelo pré-treinado. No entanto, a precisão, a sensibilidade e o F1-score não demonstraram melhoria no desempenho.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2023.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia Mecatrônica



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.