| Título: | Plataforma para a análise de correlação dos dados do Instituto de Pesquisa Econômica Aplicada (IPEA) |
| Autor(es): | Ribeiro, Carlos Eduardo de Oliveira Saraiva, João Gabriel Ferreira |
| Orientador(es): | Corrêa, Jan Mendonça |
| Assunto: | Análise de dados Mineração de dados Correlação (Estatística) |
| Data de apresentação: | 19-Fev-2025 |
| Data de publicação: | 5-Nov-2025 |
| Referência: | RIBEIRO, Carlos Eduardo de Oliveira; SARAIVA, João Gabriel Ferreira. Plataforma para a análise de correlação dos dados do Instituto de Pesquisa Econômica Aplicada (IPEA). 2025. 57 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2025. |
| Resumo: | A correlação é uma medida estatística que quantifica a relação e a intensidade entre duas
ou mais variáveis, indicando como uma pode prever ou estar associada à outra. Ampla mente utilizada em diversas áreas, como economia, finanças, ciências sociais e marketing,
essa ferramenta permite compreender padrões, prever comportamentos e embasar tomadas
de decisões. No entanto, é fundamental ressaltar que correlação não implica causalidade,
exigindo uma análise criteriosa para evitar conclusões equivocadas. Diante do grande
volume de variáveis nos dados disponibilizados pelo Instituto de Pesquisa Econômica
Aplicada (IPEA), este trabalho tem como objetivo o desenvolvimento de uma ferramenta
automatizada capaz de calcular e ranquear milhares de correlações, identificando auto maticamente as mais relevantes. Além disso, foi criada uma plataforma web para apresen tar essas correlações, obtidas por meio da Application Programming Interface (API) do
IPEA, permitindo ao usuário explorar e testar relações entre diferentes séries de dados.
Dessa forma, a ferramenta se torna um recurso valioso para estudos, pesquisas e tomada
de decisões. O trabalho abrange todo o processo de mineração de dados, incluindo ex tração, transformação e carga das informações. Posteriormente, foi realizado o cálculo de
42 milhões de correlações, utilizando diferentes abordagens. Entre os métodos emprega dos, destaca-se a correlação simples e a correlação com delay (deslocamento temporal),
permitindo identificar efeitos defasados de uma variável sobre outra. Considerando que
ciclos econômicos costumam ser anuais, foi aplicada a correlação com defasagem de 0
a 12 meses, buscando padrões significativos ao longo de um ano de intervalo. Por fim,
são apresentados os resultados obtidos, destacando as correlações mais relevantes e seus
metadados. Além disso, são detalhados o funcionamento da plataforma desenvolvida e a
tecnologia utilizada utilizada para processar e armazenar os dados. Com isso, o trabalho
contribui para o avanço na análise de correlações econômicas, oferecendo uma solução
automatizada para melhorar exploração de grandes volumes de informações. |
| Abstract: | Correlation is a statistical measure that quantifies the relationship and intensity between
two or more variables, indicating how one may predict or be associated with the other.
Widely used in various fields such as economics, finance, social sciences, and market ing, this tool allows the understanding of patterns, prediction of behaviors, and supports
decision-making. However, it is essential to highlight that correlation does not imply
causality, requiring careful analysis to avoid erroneous conclusions. Given the large vol ume of variables in the IPEA data, this work aims to develop an automated tool capable
of calculating and ranking thousands of correlations, automatically identifying the most
relevant ones. Additionally, a web platform was created to present these correlations,
obtained through the IPEA API, allowing users to explore and test relationships between
different data series. Thus, the tool becomes a valuable resource for studies, research,
and decision-making. The work encompasses the entire data mining process, including
extraction, transformation, and loading of information. Subsequently, the calculation of
42 million correlations is performed using different approaches. Among the methods used,
simple correlation and lagged correlation (temporal shift) are highlighted, allowing the
identification of delayed effects of one variable on another. Considering that economic
cycles are usually annual, a correlation with a lag of 0 to 12 months was applied, seeking
significant patterns over a one-year interval. Finally, the results obtained are presented,
highlighting the most relevant correlations and their metadata. Furthermore, the func tioning of the developed platform and the infrastructure used to process and store the
data are detailed. This work thus contributes to the advancement of economic correlation
analysis, offering an automated solution for exploring large volumes of information. |
| Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2025. |
| Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
| Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.