| Título: | Alocação de potência em redes JCAS utilizando aprendizado por reforço profundo |
| Autor(es): | Beleza, Breno de Almeida |
| Orientador(es): | Carvalho, Paulo Henrique Portela de |
| Coorientador(es): | Gondim, Paulo Roberto de Lira |
| Assunto: | Aprendizagem de máquina Aprendizado por reforço Aprendizado por reforço profundo |
| Data de apresentação: | 21-Fev-2025 |
| Data de publicação: | 10-Nov-2025 |
| Referência: | BELEZA, Breno de Almeida. Alocação de potência em redes JCAS utilizando aprendizado por reforço profundo. 2025. 52 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Mecatrônica) — Universidade de Brasília, Brasília, 2025. |
| Resumo: | O avanço das redes sem fio e a crescente demanda por serviços de alta capacidade tornou
essencial o desenvolvimento de tecnologias que permitam a reutilização do espectro para
comunicação e sensoriamento do ambiente, dando origem aos sistemas de comunicação
e sensoriamento integrados (JCAS, do inglês joint communication and sensing). Um dos
principais desafios desses sistemas é a alocação eficiente de potência para garantir o equi líbrio entre a qualidade da comunicação e do sensoriamento. As técnicas de aprendizado
de máquina (ML), em especial aprendizado por reforço profundo (DRL), surgem como
alternativas promissoras para o controle de potência, devido a sua capacidade de adaptação
a ambientes dinâmicos e complexos. Nesse contexto, outro desafio de grande preocupação é
o de proteção e privacidade dos dados dos usuários, usados para o treinamento das redes
DRL. Para lidar com esse problema, surgiu o paradigma de aprendizado federado (FL), que
permite o treinamento colaborativo e local, no qual o modelo central é treinado a partir
da agregação de parâmetros dos modelos locais, sem que haja necessidade de transmissão
de dados dos usuários. Este trabalho propõe uma abordagem baseada em DRL federado
para a alocação de potência em redes JCAS, analisado em três configurações diferentes de
comunicação, explorando os algoritmos Proximal Policy Optimization (PPO) e REINFORCE,
com o objetivo de avaliar o impacto da descentralização do aprendizado sobre a eficiência
da alocação de potência, em termos da probabilidade de outage e da relação sinal ruído
mais interferência (SNIR) das comunicações e dos sensores, comparando o desempenho dos
modelos federados com as abordagens centralizadas tradicionais. Os resultados mostraram
leve piora no desempenho da solução federada, quando comparada com a centralizada,
porém sem expressividade suficiente para invalidar o emprego do FL, tendo em vista as
vantagens de privacidade e segurança. |
| Abstract: | The advancement of wireless networks and the growing demand for high-capacity services
have made it essential to develop technologies that enable spectrum reuse for both com munication and environmental sensing, givind rise to joint communication and sensing
(JCAS) systems. One of the main challenges of these systems is the efficient power allocation
to ensure a balance between the quality of communication and the accuracy of sensing.
Machine learning (ML) techniques, particularly deep reinforcement learning (DRL), have
emerged as promising alternatives for power control due to their ability to adapt to dynamic
and complex environments. In this context, another major concern is the protection and
privacy of user data used to train DRL networks. To address this issue, the paradigm of
federated learning (FL) has emerged, enabling collaborative and local training, in which the
central model is trained by aggregating parameters from local models without requiring the
transmission of user data. This work proposes a federated DRL-based approach for power
allocation in JCAS networks, analyzed in three different communication configurations, ex ploring the Proximal Policy Optimization (PPO) and REINFORCE algorithms. The objective
is to evaluate the impact of learning decentralization on power allocation efficiency in terms
of communication and sensor outage probabilities and signal-to-noise-plus-interference
ratio (SNIR), comparing the performance of federated models with traditional centralized
approaches. The results showed a slight decrease in the performance of the federated solution
compared to the centralized one; however, this degradation was not significant enough to
invalidate the use of FL, considering its privacy and security advantages. |
| Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2025. |
| Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
| Aparece na Coleção: | Engenharia Mecatrônica
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.