Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Ramos, Guilherme Novaes | - |
dc.contributor.author | Portela, Matheus Vieira | - |
dc.identifier.citation | PORTELA, Matheus Vieira. Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos. 2015. vi, 53 f., il. Monografia (Bacharelado em Engenharia Mecatrônica)—Universidade de Brasília, Brasília, 2015. | pt_BR |
dc.description | Monografia (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Curso de Graduação em Engenharia de Controle e Automação, 2015. | pt_BR |
dc.description.abstract | Agentes inteligentes agem baseados nas suas medições sensoriais a fim de alcançar seus objetivos. Em ambientes dinâmicos, como sistemas multiagentes, agentes devem adaptar seus processos de seleção de ações de acordo com o estado do sistema mutável, uma vez que comportamentos anteriormente considerados adequados podem tornar-se sub-ótimos. Tal problema é ainda maior se o ambiente é estocástico, forçando os agentes a lidarem com incertezas. Esse trabalho propõe um algoritmo de aprendizado por reforço para sistemas multiagentes estocásticos, utilizando programação bayesiana para estimação de estados e Q-learning com aproximação de funções para prover aos agentes a capacidade de aprender a selecionar os comportamentos mais adequados. Experimentos indicam resultados positivos para a abordagem, onde agentes aprenderam a cooperar, de forma autônoma, em um jogo eletrônico estocástico multiagente. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Sistema multiagente | pt_BR |
dc.subject.keyword | Inteligência artificial | pt_BR |
dc.subject.keyword | Programação bayesiana | pt_BR |
dc.subject.keyword | Robótica | pt_BR |
dc.title | Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2016-12-22T20:08:59Z | - |
dc.date.available | 2016-12-22T20:08:59Z | - |
dc.date.submitted | 2015-12 | - |
dc.identifier.uri | http://bdm.unb.br/handle/10483/15302 | - |
dc.language.iso | Português | pt_BR |
dc.description.abstract1 | Intelligent agents act based on sensor measurements in order to fulfill their goals. When the environment is dynamic, such as a multiagent system, agents must adapt their action selection processes according to the changes in the system’s state, given that behaviors that previously were considered the best choice may becomes sub-optimal. This problem is even greater when the environment is stochastic, forcing the agents to deal with uncertainties. This work proposes a reinforcement learning algorithm for stochastic multiagent systems, using Bayesian programming for state estimation and Q-learning with function approximation to provide the agents with capabilities to select the most appropriate behaviors. The experiments indicate positive results for this approach, where agents autonomously learned to cooperate in a stochastic multiagent digital game. | pt_BR |
Aparece na Coleção: | Engenharia Mecatrônica
|