Mineração de dados socioeconômicos do World Bank

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/42285

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2025_LuthieryCavalcante_FernandoCordeiro_tcc.pdf		2,99 MB	Adobe PDF	ver/abrir

Título:	Mineração de dados socioeconômicos do World Bank
Autor(es):	Cavalcante, Luthiery Costa Cordeiro, Fernando Ferreira
Orientador(es):	Corrêa, Jan Mendonça
Assunto:	Linguagem de programação - Python Mineração de dados Aprendizado de máquina
Data de apresentação:	9-Ago-2025
Data de publicação:	11-Nov-2025
Referência:	CAVALCANTE, Luthiery Costa; CORDEIRO, Fernando Ferreira. Mineração de dados socioeconômicos do World Bank. 2025. 129 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2025.
Resumo:	A análise de indicadores socioeconômicos, como o PIB, é fundamental para entender as dinâmicas econômicas e sociais de países e regiões ao longo do tempo. No entanto, a complexidade e a grande quantidade de dados disponíveis, muitas vezes com milhares de atributos, exigem métodos eficientes tanto para extração de informações quanto para previsão de padrões e tendências. Este trabalho utilizou técnicas de mineração de dados e Aprendizado de Máquina, como apoio do ecossistema Python e ferramentas como Pandas e Scikit-Learn, para abordar esse desafio. A partir de uma base de dados do Banco Mundial, que reúne indicadores socioeconômicos de diversos países, regiões e territórios coletados ao longo das últimas décadas, foi desenvolvido um modelo preditivo para estimar o crescimento do PIB em porcentagem. Além de avaliar a acurácia do modelo final, foram abordadas as etapas de pré-processamento e seleção de atributos, fundamentais para lidar com a alta dimensionalidade dos dados. A modelagem realizada permitiu construir com sucesso um modelo de regressão capaz de estimar a variável desejada, utilizando-se do modelo de seleção de atributos para melhorar sua performance.
Abstract:	The analysis of socioeconomic indicators, such as GDP, is essential for understanding the economic and social dynamics of countries and regions over time. However, the complexity and the vast amount of available data, often comprising thousands of attributes, require efficient methods for both information extraction and the prediction of patterns and trends. This project employs data mining and Machine Learning techniques, supported by the Python ecosystem and tools such as Pandas and Scikit-Learn, to address this challenge. Using a dataset from the World Bank, which includes socioeconomic indicators from various countries, regions, and territories collected over the past decades, the project develops a predictive model to estimate GDP growth in percentage. In addition toevaluatingtheaccuracyofthefinalmodel,theanalysisalsoexaminesthepreprocessing and feature selection steps, which are crucial for handling the high dimensionality of the data. The modeling performed allowed the successful construction of a regression model capable of estimating the desired variable, using the attribute selection model to improve its performance.
Informações adicionais:	Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2025.
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:	Ciência da Computação

Mostrar item em formato completo Recomendar este item Visualizar estatísticas