Título: | Um estudo sobre redes neurais recorrentes rasas e profundas aplicadas à solução de jogos digitais : estudo de caso : Enduro |
Autor(es): | Emura, Alec Ryo |
Orientador(es): | Lamar, Marcus Vinicius |
Assunto: | Jogos digitais Redes neurais (Computação) Inteligência artificial Aprendizado do computador |
Data de apresentação: | 18-Nov-2021 |
Data de publicação: | 30-Mar-2022 |
Referência: | EMURA, Alec Ryo. Um estudo sobre redes neurais recorrentes rasas e profundas aplicadas à solução de jogos digitais - estudo de caso: Enduro. 2021. 76 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da ComputaçãoEngenharia da Computação) — Universidade de Brasília, Brasília, 2021. |
Resumo: | Este trabalho é um estudo comparativo sobre a adequação de redes neurais recorrentes
rasas e profundas na solução de jogos digitais utilizando apenas imagens, frame a frame
da tela, como entrada. São testadas as redes recorrentes rasa de Elman e profunda LSTM,
em diversas configurações, inclusive com o uso de camadas convolucionais. Como estudo
de caso, foi escolhido o jogo Enduro, de 1983 feito para o console ATARI 2600.
O sistema proposto neste trabalho foi testado com quatro tipos de modelos diferentes
variando a estruturação das sequências de dados. Os modelos avaliados foram: i) Rede
de Elman; ii) Rede LSTM; ii) Autoencoder + LSTM; e iv) Rede convolucional + LSTM.
O melhor desempenho foi obtido pela rede LSTM chegando a média de 127 pontos de
recompensa. Apesar da rede com camada convolucional ser ideal para imagens, utilizar
apenas uma camada simples deste tipo pareceu não ser o suficiente para execução desta
tarefa. |
Abstract: | This work is a comparative study on the adequacy of shallow and deep recurrent neural
networks in the solution of digital games, having as input only images, frame by frame,
of the screen. The networks tested are Elman Network and LSTM with various configurations,
including with convolutional layers. The game chosen for study is Enduro, game
released in 1983 for ATARI 2600 console. Trained models should be able to get satisfatory
score by passing cars avoiding crashing into them.
The system proposed in this work was tested with four different types of models
varying the format of the data sequences. The proposed models were: i) Elman Network;
ii) LSTM network; ii) Data processed by an autoencoder encoder followed by an LSTM
network; and iv) Network with convolutional layer and LSTM layer.
The best performance was obtained by the LSTM network averaging 127 reward
points. Although the network with convolutional layer is ideal for images, using only
a simple layer of this type did not seem to be enough to perform this task. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.