Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/43065
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2025_DaviEsmeraldoDaSilvaAlbuquerque_tcc.pdf1,01 MBAdobe PDFver/abrir
Título: Processamento de linguagem natural para aplicação de técnicas de aprendizado de máquina e reconhecimento de entidades nomeadas em portarias jurídicas
Autor(es): Albuquerque, Davi Esmeraldo da Silva
Orientador(es): Gomes, Eduardo Monteiro de Castro
Assunto: Processamento de linguagem natural (Computação)
Aprendizado de máquina
Análise de agrupamento (Estatística)
Data de apresentação: 29-Jul-2025
Data de publicação: 26-Dez-2025
Referência: ALBUQUERQUE, Davi Esmeraldo da Silva. Processamento de linguagem natural para aplicação de técnicas de aprendizado de máquina e reconhecimento de entidades nomeadas em portarias jurídicas. 2025. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) – Universidade de Brasília, Brasília, 2025.
Resumo: No presente trabalho e proposta a aplicação de técnicas de Processamento de Linguagem Natural (PLN) para a analise de portarias publicadas em 2024 pelo Gabinete da Presidencia do Tribunal de Justica do Distrito Federal e dos Territórios (TJDFT). O trabalho contempla três frentes principais: a mensuracao da similaridade semântica entre esses documentos, a identificaçao de agrupamentos tematicos e o reconhecimento de entidades nomeadas. Para tanto, os dados textuais foram extraídos por meio de técnicas de raspagem de dados (web scraping), seguidos por procedimentos de pré-processamento, vetorizacao semantica (embeddings), redução de dimensionalidade e, por fim, submetidos a modelos de agrupamento e reconhecimento de entidades nomeadas. Adicionalmente, desenvolveu-se uma aplicacao interativa em ambiente web utilizando a biblioteca Streamlit do python, com o objetivo de disseminar o acesso aos resultados deste trabalho.
Abstract: This study proposes the application of Natural Language Processing (NLP) te- chniques to analyze executive orders published in 2024 by the Office of the Presidency of the Federal District and Territories Tribunal of Justice (TJDFT). The work focuses on th- ree main fronts: measuring the semantic similarity between these documents, identifying thematic clusters, and performing named entity recognition (NER). To this end, textual data were extracted using web scraping techniques, followed by preprocessing procedures, semantic vectorization (embeddings), dimensionality reduction, and finally, submission to clustering and NER models. Additionally, an interactive web application was developed using Python’s Streamlit library, with the goal of disseminating access to the results of this study.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) – Universidade de Brasília, Departamento de Estatística, 2025.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.