Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34257
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2022_BrunoHenriqueBrandaoDeSouza_tcc.pdf559,47 kBAdobe PDFver/abrir
Título: Modelos de previsão da National Basketball Association (NBA)
Autor(es): Souza, Bruno Henrique Brandão de
Orientador(es): Gomes, Eduardo Monteiro de Castro
Assunto: Regressão logística (Estatística)
Basquetebol
Data de apresentação: 2022
Data de publicação: 22-Mar-2023
Referência: SOUZA, Bruno Henrique Brandão de. Modelos de previsão da National Basketball Association (NBA). 2022. 44 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2022.
Resumo: Esse trabalho teve como objetivo principal elaborar um modelo que fosse capaz de realizar predições se um time classifica aos playoffs da NBA com base nas estatísticas da equipe de até 26 jogos disputados. Os dados foram retirados de uma base disponibilizada no Kaggle e do site oficial da NBA via Web scraping. Esses dados eram referentes a cada partida disputada, com informações do time mandante e visitante. Depois foram criadas variáveis pelo processo de feature engineering para colaborar na predição dos modelos. Essas variáveis são relacionadas as estatísticas dos oponentes, média móvel das estatísticas dos time e dos seus adversários referente aos últimos jogos da quantidade de partidas estudadas e da força dos oponentes. Uma função foi criada para formar uma base de dados com as estatísticas para cada time de acordo com a quantidade de jogos que se deseja estudar. Depois uma outra função foi elaborada para realizar o ajuste dos modelos preditivos de acordo com a variação do número de jogos, número de jogos para a média móvel e a quantidade de temporadas utilizadas para a base de teste. Essa função elabora bancos de dados pelos parâmetros mencionados anteriormente, depois foram separadas as bases de treinamento e teste para a modelagem. As técnicas utilizadas foram de Lasso, Ridge, Random Forest e Árvore Binária. Por fim, uma grande tabela foi formada com as medidas que permitem a comparação dos modelos propostos. Após análises, foi verificado que o modelo com melhor desempenho de acordo as intenções deste trabalho foi elaborado utilizando a técnica de Random Forest, estatísticas dos 15 primeiros jogos, 4 jogos para o cálculo da média móvel e lidando com os dados das 3 últimas temporadas na base de teste dos modelos. As variáveis com maior significância foram as de vitórias, derrotas, plus-minus e suas derivações
Abstract: This work had the objective of elaborating a model capable of predicting whether or not a team will achieve the NBA playoffs, based on up to 26 matches played. The data was acquired from a database available on Kaggle and the official NBA website via Web scraping. The data is related to each match played, for both home and away team. Afterwards, variables were created based on feature engineering to collaborate on the model predictive capabilities. Such variables are related to opponent statistics, mo ving average of both teams statistics, with respect to the most recent matches played and opponent strength. A function was then created to construct a database with each teams statistics according to number of games to be studied. Next, another function was created to ajust the predictive models according to number of games played, number of games considered in the moving average and quantity of seasons used in the test database. This second function creates databases based on the aforementioned parameters. Afterwards, the test databases and training database were separated. The tecniques utilized were Lasso, Ridge, Random Forest and Binary Tree. Finally, a table was created with all the useful information in comparison of proposed models. After analyses, it was verified that the model with best performance, according to this works objectives, was utilizing Random Forest, the first 15 games, 4 games for moving average and using the three most recent seasons as a test database. The variables with greatest significance were wins, losses, plus-minus and their derivations
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.