| Título: | Sumarização extrativa de comentários no contexto de big data : um estudo de caso sobre o app Gov.br |
| Autor(es): | Melo, Henrique Amorim Costa |
| Orientador(es): | Pedrosa, Glauco Vitor |
| Assunto: | Processamento de linguagem natural (Computação) Sumarização automática Big Data Aplicativos |
| Data de apresentação: | 19-Fev-2025 |
| Data de publicação: | 27-Jan-2026 |
| Referência: | MELO, Henrique Amorim Costa. Sumarização extrativa de comentários no contexto de big data: um estudo de caso sobre o app Gov.br. 2025. 65 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2025. |
| Resumo: | Este trabalho apresenta um experimento focado na sumarização de um grande volume
de textos curtos, especificamente comentários de usuários do app Gov.br. O objetivo
principal é reduzir o conjunto massivo de comentários a um conjunto menor de textos
representativos, facilitando a análise e a tomada de decisões. Para isso, foram aplicadas
técnicas de Processamento de Linguagem Natural (PLN) e sumarização extrativa baseada
em grafos, utilizando o algoritmo LexRank, precedidas por uma etapa de filtragem de
comentários baseada em características linguísticas para remover textos irrelevantes e
redundantes, garantindo resumos concisos e representativos dos comentários dos usuários
do aplicativo Gov.br. Os resultados obtidos demonstram uma abordagem prática para
a análise de grandes volumes de textos curtos, possibilitando que os desenvolvedores
priorizem as demandas mais relevantes e implementem melhorias de forma mais eficiente. |
| Abstract: | This work presents an experiment focused on summarizing a large volume of short texts,
specifically user comments from the Gov.br app. The main objective is to reduce the
massive set of comments to a smaller set of representative texts, facilitating analysis and
decision-making. To achieve this, Natural Language Processing (NLP) techniques and
graph-based extractive summarization were applied, using the LexRank algorithm, pre ceded by a comment filtering stage based on linguistic characteristics to remove irrelevant
and redundant texts, ensuring concise and representative summaries of user comments
from the Gov.br application. The results obtained demonstrate a practical approach to
analyzing large volumes of short texts, enabling developers to prioritize the most relevant
demands and implement improvements more efficiently. |
| Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Ciências e Tecnologia em Engenharia, Engenharia de Software, 2025. |
| Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
| Aparece na Coleção: | Engenharia de Software
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.