Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/15302
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2015_MatheusVieiraPortela_tcc.pdf2,8 MBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorRamos, Guilherme Novaes-
dc.contributor.authorPortela, Matheus Vieira-
dc.identifier.citationPORTELA, Matheus Vieira. Seleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticos. 2015. vi, 53 f., il. Monografia (Bacharelado em Engenharia Mecatrônica)—Universidade de Brasília, Brasília, 2015.pt_BR
dc.descriptionMonografia (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Curso de Graduação em Engenharia de Controle e Automação, 2015.pt_BR
dc.description.abstractAgentes inteligentes agem baseados nas suas medições sensoriais a fim de alcançar seus objetivos. Em ambientes dinâmicos, como sistemas multiagentes, agentes devem adaptar seus processos de seleção de ações de acordo com o estado do sistema mutável, uma vez que comportamentos anteriormente considerados adequados podem tornar-se sub-ótimos. Tal problema é ainda maior se o ambiente é estocástico, forçando os agentes a lidarem com incertezas. Esse trabalho propõe um algoritmo de aprendizado por reforço para sistemas multiagentes estocásticos, utilizando programação bayesiana para estimação de estados e Q-learning com aproximação de funções para prover aos agentes a capacidade de aprender a selecionar os comportamentos mais adequados. Experimentos indicam resultados positivos para a abordagem, onde agentes aprenderam a cooperar, de forma autônoma, em um jogo eletrônico estocástico multiagente.pt_BR
dc.rightsAcesso Abertopt_BR
dc.subject.keywordSistema multiagentept_BR
dc.subject.keywordInteligência artificialpt_BR
dc.subject.keywordProgramação bayesianapt_BR
dc.subject.keywordRobóticapt_BR
dc.titleSeleção de comportamentos em múltiplos agentes autônomos com aprendizagem por reforço em ambientes estocásticospt_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2016-12-22T20:08:59Z-
dc.date.available2016-12-22T20:08:59Z-
dc.date.submitted2015-12-
dc.identifier.urihttp://bdm.unb.br/handle/10483/15302-
dc.language.isoPortuguêspt_BR
dc.description.abstract1Intelligent agents act based on sensor measurements in order to fulfill their goals. When the environment is dynamic, such as a multiagent system, agents must adapt their action selection processes according to the changes in the system’s state, given that behaviors that previously were considered the best choice may becomes sub-optimal. This problem is even greater when the environment is stochastic, forcing the agents to deal with uncertainties. This work proposes a reinforcement learning algorithm for stochastic multiagent systems, using Bayesian programming for state estimation and Q-learning with function approximation to provide the agents with capabilities to select the most appropriate behaviors. The experiments indicate positive results for this approach, where agents autonomously learned to cooperate in a stochastic multiagent digital game.pt_BR
Aparece na Coleção:Engenharia Mecatrônica



Este item está licenciado na Licença Creative Commons Creative Commons