Título: | Análise da predição da tendência do preço do bitcoin utilizando long short-term memory para as tarefas de regressão e classificação |
Autor(es): | Mariño, Bruno Couto |
Orientador(es): | Oliveira, Roberta Barbosa |
Assunto: | Bitcoin Criptomoeda Aprendizado de máquina Redes neurais (Computação) |
Data de apresentação: | 21-Dez-2023 |
Data de publicação: | 13-Mai-2024 |
Referência: | MARIÑO, Bruno Couto. Análise da predição da tendência do preço do bitcoin utilizando long short-term memory para as tarefas de regressão e classificação. 2023. 64 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) — Universidade de Brasília, Brasília, 2023. |
Resumo: | O trabalho de predição do preço de um ativo no mercado financeiro é uma tarefa clássica. Com o aumento da importância dos criptoativos na economia mundial, os modelos
e técnicas de aprendizado de máquina começaram a ser adaptadas para a predição desses
novos ativos. Este trabalho propõe uma análise da predição da tendência do preço do Bitcoin para as técnicas de regressão e de classificação utilizando o modelo Long Short-Term
Memory (LSTM). Também apresenta uma forma de comparar as técnicas, ao transformar
o valor encontrado pelo modelo de regressão em classes e analisar os resultados a partir
das métricas de desempenho de classificação. Para esse objetivo, são utilizados os preços
diários de abertura e de fechamento, máximo e mínimo diários e o volume de negociações
em dólares. A classificação utiliza três classes, que são definidas a partir de um limite
superior e inferior de variação percentual do preço; já a regressão utiliza o log base 10 do
preço de fechamento como alvo. Então, os resultados da regressão são transformados em
variação percentual e classificados de acordo com os limites de 3%, 5% e 7%. Assim é
possível analisar os resultados das métricas de classificação para o modelo de regressão. O
melhor cenário para o modelo de classificação apresentou janela de tempo de 15 dias, um
limite de 7% e previu a classe da tendência do preço para 1 dia no futuro. Ele obteve um
desempenho de 0,95789 para acurácia, precisão, revocação e f1-score; e um Area Under
the ROC Curve médio de 0,96842. Em relação ao modelo de regressão, o melhor cenário
utilizou janela de tempo de 30 dias, previu o log do preço para 1 dia no futuro. O modelo
alcançou um desempenho de 0,01274 para o Mean Absolute Error, 0,00027 para Mean
Squared Error, 0,01667 para Root Mean Squared Error, 0,28828% para Mean Absolute
Percentage Error e 0,98042 para o R2
. Após transformar o resultado da regressão em
classes de acordo com a variação percentual predita, ele obteve um desempenho para um
limite de 7% de 0,94553 para acurácia, precisão, revocação e f1-score; e um Area Under
the ROC Curve médio de 0,95915. Ao comparar ambas as técnicas, a classificação se
mostrou mais assertiva. |
Abstract: | Predicting the price of an asset in the financial market is a classic challenge. With the
increasing importance of cryptoassets in the world economy, machine learning models
and techniques began to be adapted to predict these new assets. This paper proposes
an analysis of Bitcoin price trend prediction using regression and classification techniques
employing the Long Short-Term Memory (LSTM) model. It also introduces a way to compare these techniques by transforming the value found by the regression model into classes
and analyzing the results using classification performance metrics. For this purpose, daily
opening and closing prices, daily highs and lows, and trading volume in American dollars are used. Classification involves three classes defined by upper and lower limits of
percentage variation in price, while regression uses the base 10 logarithm of the closing
price as the target. The regression results are transformed into percentage variation and
classified according to 3%, 5%, and 7% limits. This allows analyzing the classification
metrics results for the regression model. The optimal scenario for the classification model
presented a 15-day time window, a 7% limit, and predicted the price trend class for 1 day
ahead. It achieved a performance of 0.95789 for accuracy, precision, recall, and f1-score,
and an average Area Under the ROC Curve of 0.96842. Regarding the regression model,
the best scenario used a 30-day time window and predicted the log of the price for 1 day
ahead. It achieved a performance of 0.01274 for Mean Absolute Error, 0.00027 for Mean
Squared Error, 0.01667 for Root Mean Squared Error, 0.28828% for Mean Absolute Percentage Error, and 0.98042 for R2
. After transforming the regression result into classes
based on the predicted percentage variation, it obtained a performance for a 7% limit of
0.94553 for accuracy, precision, recall, and f1-score, and an average Area Under the ROC
Curve of 0.95915. When comparing both techniques, classification proved to be more
accurate. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.