Título: | Modelos de previsão da National Basketball Association (NBA) |
Autor(es): | Souza, Bruno Henrique Brandão de |
Orientador(es): | Gomes, Eduardo Monteiro de Castro |
Assunto: | Regressão logística (Estatística) Basquetebol |
Data de apresentação: | 2022 |
Data de publicação: | 22-Mar-2023 |
Referência: | SOUZA, Bruno Henrique Brandão de. Modelos de previsão da National Basketball Association (NBA). 2022. 44 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2022. |
Resumo: | Esse trabalho teve como objetivo principal elaborar um modelo que fosse capaz
de realizar predições se um time classifica aos playoffs da NBA com base nas estatísticas
da equipe de até 26 jogos disputados.
Os dados foram retirados de uma base disponibilizada no Kaggle e do site oficial
da NBA via Web scraping. Esses dados eram referentes a cada partida disputada, com
informações do time mandante e visitante. Depois foram criadas variáveis pelo processo
de feature engineering para colaborar na predição dos modelos. Essas variáveis são relacionadas as estatísticas dos oponentes, média móvel das estatísticas dos time e dos seus
adversários referente aos últimos jogos da quantidade de partidas estudadas e da força
dos oponentes. Uma função foi criada para formar uma base de dados com as estatísticas
para cada time de acordo com a quantidade de jogos que se deseja estudar. Depois uma
outra função foi elaborada para realizar o ajuste dos modelos preditivos de acordo com
a variação do número de jogos, número de jogos para a média móvel e a quantidade de
temporadas utilizadas para a base de teste. Essa função elabora bancos de dados pelos
parâmetros mencionados anteriormente, depois foram separadas as bases de treinamento
e teste para a modelagem. As técnicas utilizadas foram de Lasso, Ridge, Random Forest
e Árvore Binária. Por fim, uma grande tabela foi formada com as medidas que permitem
a comparação dos modelos propostos.
Após análises, foi verificado que o modelo com melhor desempenho de acordo as
intenções deste trabalho foi elaborado utilizando a técnica de Random Forest, estatísticas
dos 15 primeiros jogos, 4 jogos para o cálculo da média móvel e lidando com os dados das
3 últimas temporadas na base de teste dos modelos. As variáveis com maior significância
foram as de vitórias, derrotas, plus-minus e suas derivações |
Abstract: | This work had the objective of elaborating a model capable of predicting whether
or not a team will achieve the NBA playoffs, based on up to 26 matches played.
The data was acquired from a database available on Kaggle and the official NBA
website via Web scraping. The data is related to each match played, for both home and
away team. Afterwards, variables were created based on feature engineering to collaborate
on the model predictive capabilities. Such variables are related to opponent statistics, mo ving average of both teams statistics, with respect to the most recent matches played and
opponent strength. A function was then created to construct a database with each teams
statistics according to number of games to be studied. Next, another function was created
to ajust the predictive models according to number of games played, number of games
considered in the moving average and quantity of seasons used in the test database. This
second function creates databases based on the aforementioned parameters. Afterwards,
the test databases and training database were separated. The tecniques utilized were
Lasso, Ridge, Random Forest and Binary Tree. Finally, a table was created with all the
useful information in comparison of proposed models.
After analyses, it was verified that the model with best performance, according
to this works objectives, was utilizing Random Forest, the first 15 games, 4 games for
moving average and using the three most recent seasons as a test database. The variables
with greatest significance were wins, losses, plus-minus and their derivations |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Estatística
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.