Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/42123
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2025_CarlosEduardoRibeiro_JoaoGabrielSaraiva_tcc.pdf1,65 MBAdobe PDFver/abrir
Título: Plataforma para a análise de correlação dos dados do Instituto de Pesquisa Econômica Aplicada (IPEA)
Autor(es): Ribeiro, Carlos Eduardo de Oliveira
Saraiva, João Gabriel Ferreira
Orientador(es): Corrêa, Jan Mendonça
Assunto: Análise de dados
Mineração de dados
Correlação (Estatística)
Data de apresentação: 19-Fev-2025
Data de publicação: 5-Nov-2025
Referência: RIBEIRO, Carlos Eduardo de Oliveira; SARAIVA, João Gabriel Ferreira. Plataforma para a análise de correlação dos dados do Instituto de Pesquisa Econômica Aplicada (IPEA). 2025. 57 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2025.
Resumo: A correlação é uma medida estatística que quantifica a relação e a intensidade entre duas ou mais variáveis, indicando como uma pode prever ou estar associada à outra. Ampla mente utilizada em diversas áreas, como economia, finanças, ciências sociais e marketing, essa ferramenta permite compreender padrões, prever comportamentos e embasar tomadas de decisões. No entanto, é fundamental ressaltar que correlação não implica causalidade, exigindo uma análise criteriosa para evitar conclusões equivocadas. Diante do grande volume de variáveis nos dados disponibilizados pelo Instituto de Pesquisa Econômica Aplicada (IPEA), este trabalho tem como objetivo o desenvolvimento de uma ferramenta automatizada capaz de calcular e ranquear milhares de correlações, identificando auto maticamente as mais relevantes. Além disso, foi criada uma plataforma web para apresen tar essas correlações, obtidas por meio da Application Programming Interface (API) do IPEA, permitindo ao usuário explorar e testar relações entre diferentes séries de dados. Dessa forma, a ferramenta se torna um recurso valioso para estudos, pesquisas e tomada de decisões. O trabalho abrange todo o processo de mineração de dados, incluindo ex tração, transformação e carga das informações. Posteriormente, foi realizado o cálculo de 42 milhões de correlações, utilizando diferentes abordagens. Entre os métodos emprega dos, destaca-se a correlação simples e a correlação com delay (deslocamento temporal), permitindo identificar efeitos defasados de uma variável sobre outra. Considerando que ciclos econômicos costumam ser anuais, foi aplicada a correlação com defasagem de 0 a 12 meses, buscando padrões significativos ao longo de um ano de intervalo. Por fim, são apresentados os resultados obtidos, destacando as correlações mais relevantes e seus metadados. Além disso, são detalhados o funcionamento da plataforma desenvolvida e a tecnologia utilizada utilizada para processar e armazenar os dados. Com isso, o trabalho contribui para o avanço na análise de correlações econômicas, oferecendo uma solução automatizada para melhorar exploração de grandes volumes de informações.
Abstract: Correlation is a statistical measure that quantifies the relationship and intensity between two or more variables, indicating how one may predict or be associated with the other. Widely used in various fields such as economics, finance, social sciences, and market ing, this tool allows the understanding of patterns, prediction of behaviors, and supports decision-making. However, it is essential to highlight that correlation does not imply causality, requiring careful analysis to avoid erroneous conclusions. Given the large vol ume of variables in the IPEA data, this work aims to develop an automated tool capable of calculating and ranking thousands of correlations, automatically identifying the most relevant ones. Additionally, a web platform was created to present these correlations, obtained through the IPEA API, allowing users to explore and test relationships between different data series. Thus, the tool becomes a valuable resource for studies, research, and decision-making. The work encompasses the entire data mining process, including extraction, transformation, and loading of information. Subsequently, the calculation of 42 million correlations is performed using different approaches. Among the methods used, simple correlation and lagged correlation (temporal shift) are highlighted, allowing the identification of delayed effects of one variable on another. Considering that economic cycles are usually annual, a correlation with a lag of 0 to 12 months was applied, seeking significant patterns over a one-year interval. Finally, the results obtained are presented, highlighting the most relevant correlations and their metadata. Furthermore, the func tioning of the developed platform and the infrastructure used to process and store the data are detailed. This work thus contributes to the advancement of economic correlation analysis, offering an automated solution for exploring large volumes of information.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2025.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.