Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34703
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2022_MatheusErbistiPontes_tcc.pdfTrabalho de Conclusão de Curso 1,46 MBAdobe PDFver/abrir
Título: Modelagem preditiva de projetos de lei da Câmara dos Deputados
Autor(es): Pontes, Matheus Erbisti
Orientador(es): Gomes, Eduardo Monteiro de Castro
Assunto: Modelagem estatística
Análise estatística
Data de apresentação: 2022
Data de publicação: 8-Mai-2023
Referência: PONTES, Matheus Erbisti. Modelagem preditiva de projetos de lei da Câmara dos Deputados. 2022. 65 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2022.
Resumo: Dentre as quase infinitas aplicações de modelagem estatística, a predição de resultados políticos certamente se destaca como um grande desafio. Dificuldades como o volume dos dados, a imprevisibilidade de acontecimentos que transformam o mundo e o jogo político, e a complexidade da tramitações são alguns dos fatores que rapidamente trazem complicações para a construção dos modelos. Nesse sentido, os autores do presente trabalho decidiram abordar o problema sobre uma particular ótica: a predição da aprovação de projetos de lei através do texto de sua respectiva redação. Para tal, obtiveram-se conjuntos de dados contendo todas as proposições que tramitaram na Câmara dos Deputados na ´ultima década, e seus respectivos autores e temas. Após processos de limpeza e transformação, o conjunto de dados construído conteve 17.879 projetos de lei e 40 variáveis, e deu-se início da leitura e representação dos seus textos por meio de diferentes técnicas, resultando em 36 formas diferentes de matrizes de palavras. Na modelagem, aplicou-se modelos Logísticos, LASSO, Elastic Net, Naive Bayes e de Arvores em todas as matrizes, gerando-se 168 combinações distintas de modelos capazes de predizer a aprovação de projetos de lei na Câmara dos Deputados. Após análise dos métodos aplicados e cálculo de medidas de performance, obtivemos três modelos de maior destaque, um Naive Bayes e Arvore com a presença de covariáveis, e um Naive Bayes exclusivamente composto pelo ´ texto dos projetos de lei.
Abstract: Among the near infinite applications of statistical modeling, the prediction of political results is most certainly a great challenge. Difficulties such as data volume, unpredictability of events that can transform the world and its politics, and complexity of the legislative process are just a few factors that can quickly cause issues to model construction. In this sense, the authors decided to address the problem on a specific point of view: approval prediction of law bills by their respective text. As such, several datasets related to all propositions processed on the Chamber of Deputies in the last decade were obtained, as well as their respectives authors and themes. After several cleansings and transformations, the constructed dataset ended up with 17.879 bills and 40 variables, starting then the text scraping and representation phases, which lead up to 36 different word matrices. On the modeling subject, the applied models on all matrices were Logistic, LASSO, Elastic Net, Naive Bayes and Trees, generating 168 distinct combinations of models capable of predicting the approval of law bills in the Chamber of Deputies. After the implemented techniques and performance metrics analysis, three featured models were selected, a Naive Bayes and Tree with covariables, and a Naive Bayes entirely made by the law bills text.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Departamento de Estatística, 2022.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.