Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/19846
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2017_MatheusSouzaFernandes_tcc.pdf2,08 MBAdobe PDFver/abrir
Título: Tenho Dito : uma aplicação para análise de discursos parlamentares utilizando técnicas de processamento de linguagem natural
Autor(es): Fernandes, Matheus Souza
Orientador(es): Mendes, Fábio Macedo
Assunto: Análise do discurso
Aprendizado do computador
Processamento de linguagem natural (Computação)
Data de apresentação: 1-Jun-2017
Data de publicação: 6-Abr-2018
Referência: FERNANDES, Matheus Souza. Tenho Dito: uma aplicação para análise de discursos parlamentares utilizando técnicas de processamento de linguagem natural. 2017. 88 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software)—Universidade de Brasília, Brasília, 2017.
Resumo: O processamento de linguagem natural tem sido utilizado com sucesso na área de análise de discurso, onde é possível reconhecer padrões e classificar textos, extraindo informações de grandes volumes de dados. Este trabalho tem como objetivo extrair o perfil temático dos deputados federais, através do processamento dos textos obtidos de seus discursos e proposições, bem como desenvolver uma aplicação web para que os resultados dessa pesquisa sejam apresentados de forma lúdica e amigável. O texto discute as técnicas de processamento de linguagem natural utilizadas nesta análise, que incluem a remoção de palavras com pouco significado semântico (stop words), algumas técnicas de redução dos termos à suas raízes morfológicas (stemização), representação computacional dos textos (bag-of-words) e utilização do modelo de aprendizado de máquina supervisionado naive Bayes para a classificação temática dos discursos e proposições.
Abstract: Natural language processing has been used successfully in the analysis of discourse enabling systems to recognize patterns and classify texts, extracting information from large volume of data. This work aims to extract the thematic profile of members of parliament through the processing of texts obtained from their speeches and proposals, as well as to develop a web application in wich the results of this analysis are presented in a friendly way. The text discusses the natural language processing techniques used in this analysis, which include the removal of words with little semantic meaning (stop words), some techniques of reducing the terms to their morphological roots (stemming), computational representation of texts (bag-of-words) and use of supervised machine learning model, naive Bayes, for the thematic classification of the speeches and proposals.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade UnB Gama, 2017.
Aparece na Coleção:Engenharia de Software



Este item está licenciado na Licença Creative Commons Creative Commons