Título: | Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural |
Autor(es): | Moura, Teógenes |
Orientador(es): | Gonçalves, Vinícius Pereira |
Assunto: | Eleições Ferramentas de busca na Web Pesquisa na Internet Processamento eletrônico de dados |
Data de apresentação: | 4-Jul-2019 |
Data de publicação: | 15-Out-2021 |
Referência: | MOURA, Teógenes. Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural. 2019. 68 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019. |
Resumo: | A discussão acerca dos efeitos das tecnologias digitais sobre a democracia passaram a
receber muita atenção desdde o advento das mídias sociais e dispositivos móveis. Neste
documento, nós entramos na discussão sobre mecanismos de busca e seus efeitos políticos,
cuja importância aumentou significativamente após a eleição norte-americana de 2016.
Nosso estudo foca na eleição geral brasileira de 2018,um processo bastante conturbado
que levou a eleição de um Presidente de extrema direita. O artigo primeiro descreve o
processo de aquisição dos dados. Nós construímos um processo de treinamento-busca-
coleta no qual criamos contas avatares com a intenção de representar, o mais fielmente
possível, eleitores dos espectros políticos da esquerda e da direita. Então, utilizamos
um processo automatizado para fazer buscas de modo que o Google pudesse entender
as diferenças entre perfis. Por fim, repetidamente coletamos os resultados mostrados
a cada usuário durante o período da eleição, baseados numa lista geral de termos de
buscas, que resultou num banco de dados contendo aproximadamente 300 mil URLs.
Utilizamos o algoritmo Word2Vec, uma técnica que nos permite observar quais palavras e
frases estão mais proximamente associados a tópicos sensíveis da eleição, como ’Fernando
Haddad’ e ’Jair Bolsonaro’. Coletamos uma base de 2 milhões de palavras e conseguimos
demonstrar o uso de retórica violenta em ambos os lados da disucssão, com palavras como
’medo’ e ’agressão’ aparecendo relacionadas a Fernando Haddad, enquanto ’inimigo’ e
’nazista’ aparecem próximas a Jair Bolsonaro, o que demonstra uma eleição extremamente
polarizada. |
Abstract: | The discussion around the effects of digital technology on democracy gained the spotlight
since the rise of social media and mobile devices. In this paper, we shed light into
the discussion around search engines and their political effects, which gained a lot of
momentum after the 2016 US Election. Our study focuses on the Brazilian General
Election of 2018, a highly disruptive electoral process, which led to the election of an
extreme right-wing President. This paper first describes the process of gathering the data.
We set up a training-searching-collecting framework in which we created avatar accounts
intending to represent, as accurately as possible, the digital behavior of voters belonging
to the right and left spectrums of the political debate. Then, we used an automated
to approach to make queries on their behalf so that Google understands the differences
between the profiles. Lastly, we repeatedly collected the results shown by Google to each
user during the election period, based on a common list of search terms which result in
300 thousand URL records in our database. We then analyzed the titles of the URLs
shown by Google, as well as the contents of the texts of each link in the results. We used
the Word2Vec algorithm, a Natural Language Processing technique which allows us to
determine words and phrases closely associated with key topics in the election, such as the
main Presidential candidates’ names: Fernando Haddad and Jair Bolsonaro. We collect
a dataset of more than 2M words and are able to demonstrate the use of violent rhetoric
on both sides of the discussion, with words such as ’fear’ and ’agression’ appearing closely
related to Fernando Haddad, while ’enemy’ and ’nazist’ are seen next to Jair Bolsonaro,
which are results that clearly demonstrate an extremely polarized election process. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.