Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/28923
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2019_TeogenesMoura_tcc.pdf2,18 MBAdobe PDFver/abrir
Título: Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
Autor(es): Moura, Teógenes
Orientador(es): Gonçalves, Vinícius Pereira
Assunto: Eleições
Ferramentas de busca na Web
Pesquisa na Internet
Processamento eletrônico de dados
Data de apresentação: 4-Jul-2019
Data de publicação: 15-Out-2021
Referência: MOURA, Teógenes. Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural. 2019. 68 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019.
Resumo: A discussão acerca dos efeitos das tecnologias digitais sobre a democracia passaram a receber muita atenção desdde o advento das mídias sociais e dispositivos móveis. Neste documento, nós entramos na discussão sobre mecanismos de busca e seus efeitos políticos, cuja importância aumentou significativamente após a eleição norte-americana de 2016. Nosso estudo foca na eleição geral brasileira de 2018,um processo bastante conturbado que levou a eleição de um Presidente de extrema direita. O artigo primeiro descreve o processo de aquisição dos dados. Nós construímos um processo de treinamento-busca- coleta no qual criamos contas avatares com a intenção de representar, o mais fielmente possível, eleitores dos espectros políticos da esquerda e da direita. Então, utilizamos um processo automatizado para fazer buscas de modo que o Google pudesse entender as diferenças entre perfis. Por fim, repetidamente coletamos os resultados mostrados a cada usuário durante o período da eleição, baseados numa lista geral de termos de buscas, que resultou num banco de dados contendo aproximadamente 300 mil URLs. Utilizamos o algoritmo Word2Vec, uma técnica que nos permite observar quais palavras e frases estão mais proximamente associados a tópicos sensíveis da eleição, como ’Fernando Haddad’ e ’Jair Bolsonaro’. Coletamos uma base de 2 milhões de palavras e conseguimos demonstrar o uso de retórica violenta em ambos os lados da disucssão, com palavras como ’medo’ e ’agressão’ aparecendo relacionadas a Fernando Haddad, enquanto ’inimigo’ e ’nazista’ aparecem próximas a Jair Bolsonaro, o que demonstra uma eleição extremamente polarizada.
Abstract: The discussion around the effects of digital technology on democracy gained the spotlight since the rise of social media and mobile devices. In this paper, we shed light into the discussion around search engines and their political effects, which gained a lot of momentum after the 2016 US Election. Our study focuses on the Brazilian General Election of 2018, a highly disruptive electoral process, which led to the election of an extreme right-wing President. This paper first describes the process of gathering the data. We set up a training-searching-collecting framework in which we created avatar accounts intending to represent, as accurately as possible, the digital behavior of voters belonging to the right and left spectrums of the political debate. Then, we used an automated to approach to make queries on their behalf so that Google understands the differences between the profiles. Lastly, we repeatedly collected the results shown by Google to each user during the election period, based on a common list of search terms which result in 300 thousand URL records in our database. We then analyzed the titles of the URLs shown by Google, as well as the contents of the texts of each link in the results. We used the Word2Vec algorithm, a Natural Language Processing technique which allows us to determine words and phrases closely associated with key topics in the election, such as the main Presidential candidates’ names: Fernando Haddad and Jair Bolsonaro. We collect a dataset of more than 2M words and are able to demonstrate the use of violent rhetoric on both sides of the discussion, with words such as ’fear’ and ’agression’ appearing closely related to Fernando Haddad, while ’enemy’ and ’nazist’ are seen next to Jair Bolsonaro, which are results that clearly demonstrate an extremely polarized election process.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.