Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/42285
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2025_LuthieryCavalcante_FernandoCordeiro_tcc.pdf2,99 MBAdobe PDFver/abrir
Título: Mineração de dados socioeconômicos do World Bank
Autor(es): Cavalcante, Luthiery Costa
Cordeiro, Fernando Ferreira
Orientador(es): Corrêa, Jan Mendonça
Assunto: Linguagem de programação - Python
Mineração de dados
Aprendizado de máquina
Data de apresentação: 9-Ago-2025
Data de publicação: 11-Nov-2025
Referência: CAVALCANTE, Luthiery Costa; CORDEIRO, Fernando Ferreira. Mineração de dados socioeconômicos do World Bank. 2025. 129 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2025.
Resumo: A análise de indicadores socioeconômicos, como o PIB, é fundamental para entender as dinâmicas econômicas e sociais de países e regiões ao longo do tempo. No entanto, a complexidade e a grande quantidade de dados disponíveis, muitas vezes com milhares de atributos, exigem métodos eficientes tanto para extração de informações quanto para previsão de padrões e tendências. Este trabalho utilizou técnicas de mineração de dados e Aprendizado de Máquina, como apoio do ecossistema Python e ferramentas como Pandas e Scikit-Learn, para abordar esse desafio. A partir de uma base de dados do Banco Mundial, que reúne indicadores socioeconômicos de diversos países, regiões e territórios coletados ao longo das últimas décadas, foi desenvolvido um modelo preditivo para estimar o crescimento do PIB em porcentagem. Além de avaliar a acurácia do modelo final, foram abordadas as etapas de pré-processamento e seleção de atributos, fundamentais para lidar com a alta dimensionalidade dos dados. A modelagem realizada permitiu construir com sucesso um modelo de regressão capaz de estimar a variável desejada, utilizando-se do modelo de seleção de atributos para melhorar sua performance.
Abstract: The analysis of socioeconomic indicators, such as GDP, is essential for understanding the economic and social dynamics of countries and regions over time. However, the complexity and the vast amount of available data, often comprising thousands of attributes, require efficient methods for both information extraction and the prediction of patterns and trends. This project employs data mining and Machine Learning techniques, supported by the Python ecosystem and tools such as Pandas and Scikit-Learn, to address this challenge. Using a dataset from the World Bank, which includes socioeconomic indicators from various countries, regions, and territories collected over the past decades, the project develops a predictive model to estimate GDP growth in percentage. In addition toevaluatingtheaccuracyofthefinalmodel,theanalysisalsoexaminesthepreprocessing and feature selection steps, which are crucial for handling the high dimensionality of the data. The modeling performed allowed the successful construction of a regression model capable of estimating the desired variable, using the attribute selection model to improve its performance.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2025.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.