Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/7711
Título: | Mineração de opinião em textos opinativos utilizando algoritmos de classificação |
Autor(es): | Santos, Fernando Leandro dos |
Orientador(es): | Ladeira, Marcelo |
Assunto: | Mineração de dados Mineração de texto Processamento eletrônico de dados |
Data de apresentação: | 20-Dez-2013 |
Data de publicação: | 18-Jun-2014 |
Referência: | SANTOS, Fernando. Mineração de opinião em textos opinativos utilizando algoritmos de classificação. 2013. xi, 60 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2013. |
Resumo: | Este trabalho descreve uma análise de mineração de opinião realizada sobre uma base de dados extraída da intenet e composta de comentários que contêm gírias, abreviações e outros jargões da internet. A mineração de opinião é a área de estudos que tenta identificar e classificar a subjetividade, como opiniões, emoções ou sentimentos na linguagem natural. Nesta pesquisa, 759 mil comentários em português foram extraídos da loja de aplicativos Google Play. Devido à grande quantidade de comentários, foram necessárias técnicas de processamento distribuído, envolvendo ferramentas poderosas como o Hadoop e o Mahout. O trabalho teve como principal constatação a verificação da baixa eficácia do pré-processamento em textos para a tarefa de mineração de opinião no domínio tratado. O trabalho também contribuiu com a criação de um corpus composto por 759 mil comentários e um dicionário de gírias, abreviações da Internet. _____________________________________________________________________________ ABSTRACT This work describes an opinion mining aplication over a dataset extracted from the web and composed of reviews with lots of internet slangs, abbreviations and typo errors. Opinion mining is a study field that tries to identify and classify subjectivity, such as opinions, emotions or sentiments in natural language. In this research, 759 thousand portuguese reviews were extracted from the app store Google Play. Due to the large amount of reviews, large scale processing techniques were needed, envolving powerful frameworks such as Hadoop and Mahout. The main contribution of this research was to verify the low efficiency of pre-processing techniques in the opinion mining task for the treated domain. The work also contributed to the creation of a corpus consisting of 759 thousand reviews and a dictionary of slangs and abbreviations commonly used in the Internet. |
Informações adicionais: | Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013. |
Aparece na Coleção: | Ciência da Computação
|
Este item está licenciado na Licença Creative Commons