Aprendizado por reforço aplicado ao ambiente Toy Text da plataforma Gym

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/21559

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2018_ElmarRobertoCaixetaFilho_tcc.pdf		646,63 kB	Adobe PDF	ver/abrir

Título:	Aprendizado por reforço aplicado ao ambiente Toy Text da plataforma Gym
Autor(es):	Caixeta Filho, Elmar Roberto
Orientador(es):	Faria, Matheus de Sousa
Assunto:	Inteligência artificial
Data de apresentação:	1-Jun-2018
Data de publicação:	28-Fev-2019
Referência:	CAIXETA FILHO, Elmar Roberto. Aprendizado por reforço aplicado ao ambiente Toy Text da plataforma Gym. 2018. 55 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software)—Universidade de Brasília, Brasília, 2018.
Resumo:	Será apresentado neste trabalho a aplicação de uma abordagem de aprendizagem por reforço, Q-Learning, no ambiente de treinamento e abstração de jogos, Toy Text, disponível na ferramenta Gym. O ambiente escolhido possui uma interface numérica em texto, sendo o Taxi como jogo usado para aplicação. Não houve modificações algorítmicas e todas as adições de parâmetros foram baseadas em padrões e conceito da própria abordagem que visam a resolução de alguns problemas conhecidos, como exemplo, o controle do processo markoviano. Fora implementado um agente com ações aleatórias para a comparação e análise dos resultados dos treinamentos.
Abstract:	In this paper we will present the application of a reinforcement learning (RL) approach, QLearning, in the game training and abstraction environment, Toy Games, available in the Gym toolkit. The chosen environment has a text numeric interface, being Taxi as game used for analyze. There were no algorithmic modifications and all parameter additions were based on standards and concept of the approach itself that aims the resolution of some known problems such as control of the Markovian process. An agent with random actions was implemented to compare and analyze the results of the training.
Informações adicionais:	Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade UnB Gama, 2018.
Aparece na Coleção:	Engenharia de Software

Mostrar item em formato completo Recomendar este item Visualizar estatísticas

Este item está licenciado na Licença Creative Commons