Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/15302

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2015_MatheusVieiraPortela_tcc.pdf		2,8 MB	Adobe PDF	ver/abrir

Título:	Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos
Autor(es):	Portela, Matheus Vieira
Orientador(es):	Ramos, Guilherme Novaes
Assunto:	Sistema multiagente Inteligência artificial Programação bayesiana Robótica
Data de apresentação:	Dez-2015
Data de publicação:	22-Dez-2016
Referência:	PORTELA, Matheus Vieira. Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos. 2015. vi, 53 f., il. Monografia (Bacharelado em Engenharia Mecatrônica)—Universidade de Brasília, Brasília, 2015.
Resumo:	Agentes inteligentes agem baseados nas suas medições sensoriais a fim de alcançar seus objetivos. Em ambientes dinâmicos, como sistemas multiagentes, agentes devem adaptar seus processos de seleção de ações de acordo com o estado do sistema mutável, uma vez que comportamentos anteriormente considerados adequados podem tornar-se sub-ótimos. Tal problema é ainda maior se o ambiente é estocástico, forçando os agentes a lidarem com incertezas. Esse trabalho propõe um algoritmo de aprendizado por reforço para sistemas multiagentes estocásticos, utilizando programação bayesiana para estimação de estados e Q-learning com aproximação de funções para prover aos agentes a capacidade de aprender a selecionar os comportamentos mais adequados. Experimentos indicam resultados positivos para a abordagem, onde agentes aprenderam a cooperar, de forma autônoma, em um jogo eletrônico estocástico multiagente.
Abstract:	Intelligent agents act based on sensor measurements in order to fulfill their goals. When the environment is dynamic, such as a multiagent system, agents must adapt their action selection processes according to the changes in the system’s state, given that behaviors that previously were considered the best choice may becomes sub-optimal. This problem is even greater when the environment is stochastic, forcing the agents to deal with uncertainties. This work proposes a reinforcement learning algorithm for stochastic multiagent systems, using Bayesian programming for state estimation and Q-learning with function approximation to provide the agents with capabilities to select the most appropriate behaviors. The experiments indicate positive results for this approach, where agents autonomously learned to cooperate in a stochastic multiagent digital game.
Informações adicionais:	Monografia (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Curso de Graduação em Engenharia de Controle e Automação, 2015.
Aparece na Coleção:	Engenharia Mecatrônica

Mostrar item em formato completo Recomendar este item Visualizar estatísticas

Este item está licenciado na Licença Creative Commons