Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/15302
Título: | Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos |
Autor(es): | Portela, Matheus Vieira |
Orientador(es): | Ramos, Guilherme Novaes |
Assunto: | Sistema multiagente Inteligência artificial Programação bayesiana Robótica |
Data de apresentação: | Dez-2015 |
Data de publicação: | 22-Dez-2016 |
Referência: | PORTELA, Matheus Vieira. Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos. 2015. vi, 53 f., il. Monografia (Bacharelado em Engenharia Mecatrônica)—Universidade de Brasília, Brasília, 2015. |
Resumo: | Agentes inteligentes agem baseados nas suas medições sensoriais a fim de alcançar seus objetivos. Em ambientes dinâmicos, como sistemas multiagentes, agentes devem adaptar seus processos de seleção de ações de acordo com o estado do sistema mutável, uma vez que comportamentos anteriormente considerados adequados podem tornar-se sub-ótimos. Tal problema é ainda maior se o ambiente é estocástico, forçando os agentes a lidarem com incertezas. Esse trabalho propõe um algoritmo de aprendizado por reforço para sistemas multiagentes estocásticos, utilizando programação bayesiana para estimação de estados e Q-learning com aproximação de funções para prover aos agentes a capacidade de aprender a selecionar os comportamentos mais adequados. Experimentos indicam resultados positivos para a abordagem, onde agentes aprenderam a cooperar, de forma autônoma, em um jogo eletrônico estocástico multiagente. |
Abstract: | Intelligent agents act based on sensor measurements in order to fulfill their goals. When the environment is dynamic, such as a multiagent system, agents must adapt their action selection processes according to the changes in the system’s state, given that behaviors that previously were considered the best choice may becomes sub-optimal. This problem is even greater when the environment is stochastic, forcing the agents to deal with uncertainties. This work proposes a reinforcement learning algorithm for stochastic multiagent systems, using Bayesian programming for state estimation and Q-learning with function approximation to provide the agents with capabilities to select the most appropriate behaviors. The experiments indicate positive results for this approach, where agents autonomously learned to cooperate in a stochastic multiagent digital game. |
Informações adicionais: | Monografia (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Curso de Graduação em Engenharia de Controle e Automação, 2015. |
Aparece na Coleção: | Engenharia Mecatrônica
|
Este item está licenciado na Licença Creative Commons