Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Vidal, Flávio de Barros | - |
dc.contributor.author | Costa, Francisco Henrique da Silva | - |
dc.contributor.author | Cruzeiro, Isabela Maria Pereira | - |
dc.identifier.citation | COSTA, Francisco Henrique da Silva; CRUZEIRO, Isabela Maria Pereira. Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers. 2023. 70 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Mecatrônica) — Universidade de Brasília, Brasília, 2023. | pt_BR |
dc.description | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2023. | pt_BR |
dc.description.abstract | A comunicação oficial do país é conduzida por meio de diários oficiais, que apresenta grande
volume de publicações em formato textual, neste ambiente existe o problema das fraudes em
licitações públicas que gera prejuízos aos cofres públicos e danos à sociedade. A identificação
de práticas corruptivas em documentos publicados nesse meio é desafiadora em termos de
acesso e organização. Nesse sentido, o trabalho proposto visa desenvolver metodologias para
a extração e organização de informações presentes nos diários oficiais, fornecendo suporte
aos tomadores de decisão no combate à corrupção e fraudes em instrumentos contratuais
publicados na Seção 3 do Diário Oficial da União. Por meio de técnicas de processamento de
linguagem natural com Transformers, é esperado que seja possível definir o relacionamento
semântico entre entidades contratuais que exigem publicação, para facilitar a visualização
de documentos correlacionados para o especialistas. Um conjunto de dados foi criado com
publicações da Seção 3 do DOU para avaliar a semelhança entre publicações de um mesmo
convênio. Realizou-se um levantamento bibliográfico e definição de tarefas, como Passage
Ranking e Semantic Textual Similarity, que fundamentaram o estudo. Por meio dos métodos
adotados, foram conduzidas análises e estudos de Sentence-Transformers para a seleção do
modelo a ser treinado. Os resultados indicam que o modelo treinado alcançou uma acurácia
de 96%, representando um avanço em relação ao modelo pré-treinado. No entanto, a precisão,
a sensibilidade e o F1-score não demonstraram melhoria no desempenho. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Processamento de linguagem natural (Computação) | pt_BR |
dc.subject.keyword | Semântica | pt_BR |
dc.title | Avaliando o relacionamento semântico de textos em publicações de Diários Oficiais a partir de modelos profundos com Transformers | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2024-08-29T14:59:07Z | - |
dc.date.available | 2024-08-29T14:59:07Z | - |
dc.date.submitted | 2023-12-14 | - |
dc.identifier.uri | https://bdm.unb.br/handle/10483/39739 | - |
dc.language.iso | Português | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. | pt_BR |
Aparece na Coleção: | Engenharia Mecatrônica
|