Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/25258
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2019_DiegoSantosKieckbusch_tcc.pdf679,49 kBAdobe PDFver/abrir
Título: Mecanismo de negociação por aprendizado por reforço no sequenciamento de decolagem de aeroportos
Autor(es): Kieckbusch, Diego Santos
Orientador(es): Weigang, Li
Assunto: Aprendizado por reforço
Computação
Aeroportos
Aeronáutica comercial
Data de apresentação: 6-Mar-2019
Data de publicação: 31-Jul-2020
Referência: KIECKBUSCH, Diego Santos. Mecanismo de negociação por aprendizado por reforço no sequenciamento de decolagem de aeroportos. 2019. 57 f. Trabalho de Conclusão de Curso (Licenciatura em Computação) — Universidade de Brasília, Brasília, 2019.
Resumo: Aprendizado por Reforço busca ensinar um agente como se comportar a partir da experimentação do ambiente e aquisição de recompensas envolvidas no processo. Para isso, o agente mapeia os estados encontrados no ambiente, as ações possíveis em cada um destes estados e as recompensas da execução destas ações nestes estados. Em um ambiente de negociação, as configurações possíveis entre as partes podem ser descritas como estados do ambiente, com as ofertas realizadas entre os oponentes constituindo ações e os acordos encontrados gerando recompensas às partes. Este trabalho busca ensinar uma aeronave em espera pela utilização da pista de decolagem a negociar sua posição com as demais. O trabalho apresenta melhorias em relação aos modelos existentes para o problema de sequenciamento de decolagens e apresenta resultados positivos nos estudos de caso realizados.
Abstract: Reinforcement Learning aims to teach an agent how to behave using only the rewards received by exploring an environment. To achieve this, the enviroment is modeled in states, the available actions in each of these states and the associated rewards gained by executing these action. In a negotiation environment, the configurations between the stakeholders may be described as states of the enviroment, with offers done by each participant beign described as actions and the outcome of the negotiation, as rewards. This paper presents a model to teach aircrafts to negotiate their position in the queue for airport runway use. This papes presents improvements over the existing methods for aircraft departure scheduling and postive results in the case studies carried out.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.