Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Borries, George Freitas von | - |
dc.contributor.author | Ramos, Rafael Costa | - |
dc.identifier.citation | RAMOS, Rafael Costa. Selecionador de características para previsão de indicadores econômicos. 2024. 76 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2023. | pt_BR |
dc.description | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2024. | pt_BR |
dc.description.abstract | Este trabalho propoe um algoritmo para reducao de dimensionalidade e selecao
de variaveis explicativas para modelos preditivos. O algoritmo consiste no agrupamento
de variaveis preditoras e na selecao aleatoria de preditores de cada grupo. A tecnica
utilizada para agrupar as variaveis foi o modelo de mistura Gaussiana (Gaussian mixture
model - GMM). Com as variaveis selecionadas de cada grupo, o modelo preditivo aplicado
e o lasso. Para avaliar estabilidade preditiva do algoritmo, a distribuicao dos erros de
previsao obtidos por reamostragem foi utilizada.
Os dados utilizados sao de natureza macroeconomica. A primeira base dados
cont´em dados de atividade economica e variaveis de producao. Ja a segunda base envolve
dados de ındices de inflacao. Ambos os conjuntos de dados sao superdimensionados, ou
seja, com mais variaveis do que observacoes (p > n). A modelagem preditiva simula um
processo de nowcasting, com previsoes de curto prazo e atualizacao dos dados a medida
em que novas informacoes ficam disponıveis.
Com os conjuntos de dados analisados, o algoritmo nao obteve previsoes estaveis.
A instabilidade preditiva mostra que os grupos de variaveis explicativas nao sao ho-
mogeneos. Portanto, o agrupamento das variaveis por GMM nao teve sucesso para reduzir
a dimensao dos dados utilizados no trabalho. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Índices macroeconômicos | pt_BR |
dc.subject.keyword | Variáveis (Matemática) | pt_BR |
dc.title | Selecionador de características para previsão de indicadores econômicos | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2024-12-13T11:54:14Z | - |
dc.date.available | 2024-12-13T11:54:14Z | - |
dc.date.submitted | 2024-08-12 | - |
dc.identifier.uri | https://bdm.unb.br/handle/10483/40947 | - |
dc.language.iso | Português | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. | pt_BR |
dc.description.abstract1 | This paper proposes an algorithm for dimensionality reduction and feature selec-
tion for predictive models. The algorithm is based on clustering and random selection of
variables of each cluster. The technique applied to cluster the attributes is the Gaussian
mixture model (GMM), a technique that relies on mixture of normal distributions. With
the variables selected, the predictive model implemented is the lasso. To evaluate the
stability of the predictions, the distribution of prediction errors obtained by resampling
is used.
The data utilized is from macroeconomic nature. The first dataset gathers data of
economic activity and production variables. The second dataset contains data of inflation
rates. Both datasets are high-dimensional, with more variables than observations (p > n).
The predictive modelling simulates a nowcasting process, with short-term forecasts and
data updates as new information becomes available.
With the datasets analysed, the algorithm did not obtain stable predictions. The
predictive instability shows that the groups of features are not homogeneous. There-
fore, the clustering of explanatory variables with GMM did not succeed in the task of
dimensionality reduction with the data available. | pt_BR |
Aparece na Coleção: | Estatística
|