Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/40947
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2024_RafaelCostaRamos_tcc.pdf724,1 kBAdobe PDFver/abrir
Título: Selecionador de características para previsão de indicadores econômicos
Autor(es): Ramos, Rafael Costa
Orientador(es): Borries, George Freitas von
Assunto: Índices macroeconômicos
Variáveis (Matemática)
Data de apresentação: 12-Ago-2024
Data de publicação: 13-Dez-2024
Referência: RAMOS, Rafael Costa. Selecionador de características para previsão de indicadores econômicos. 2024. 76 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2023.
Resumo: Este trabalho propoe um algoritmo para reducao de dimensionalidade e selecao de variaveis explicativas para modelos preditivos. O algoritmo consiste no agrupamento de variaveis preditoras e na selecao aleatoria de preditores de cada grupo. A tecnica utilizada para agrupar as variaveis foi o modelo de mistura Gaussiana (Gaussian mixture model - GMM). Com as variaveis selecionadas de cada grupo, o modelo preditivo aplicado e o lasso. Para avaliar estabilidade preditiva do algoritmo, a distribuicao dos erros de previsao obtidos por reamostragem foi utilizada. Os dados utilizados sao de natureza macroeconomica. A primeira base dados cont´em dados de atividade economica e variaveis de producao. Ja a segunda base envolve dados de ındices de inflacao. Ambos os conjuntos de dados sao superdimensionados, ou seja, com mais variaveis do que observacoes (p > n). A modelagem preditiva simula um processo de nowcasting, com previsoes de curto prazo e atualizacao dos dados a medida em que novas informacoes ficam disponıveis. Com os conjuntos de dados analisados, o algoritmo nao obteve previsoes estaveis. A instabilidade preditiva mostra que os grupos de variaveis explicativas nao sao ho- mogeneos. Portanto, o agrupamento das variaveis por GMM nao teve sucesso para reduzir a dimensao dos dados utilizados no trabalho.
Abstract: This paper proposes an algorithm for dimensionality reduction and feature selec- tion for predictive models. The algorithm is based on clustering and random selection of variables of each cluster. The technique applied to cluster the attributes is the Gaussian mixture model (GMM), a technique that relies on mixture of normal distributions. With the variables selected, the predictive model implemented is the lasso. To evaluate the stability of the predictions, the distribution of prediction errors obtained by resampling is used. The data utilized is from macroeconomic nature. The first dataset gathers data of economic activity and production variables. The second dataset contains data of inflation rates. Both datasets are high-dimensional, with more variables than observations (p > n). The predictive modelling simulates a nowcasting process, with short-term forecasts and data updates as new information becomes available. With the datasets analysed, the algorithm did not obtain stable predictions. The predictive instability shows that the groups of features are not homogeneous. There- fore, the clustering of explanatory variables with GMM did not succeed in the task of dimensionality reduction with the data available.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2024.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.