Título: | Desenvolvimento de um co-projeto hardware-software para uma rede convolucional para estimativa da frequência cardíaca fetal |
Autor(es): | Faria, Gustavo Raspante |
Orientador(es): | Beserra, Gilmar Silva |
Assunto: | FPGAs (Field Programmable Gate Arrays) Redes neurais convolucionais (Computação) VHDL (Linguagem descritiva de hardware) Frequência cardíaca fetal (FHR) |
Data de apresentação: | 12-Jul-2024 |
Data de publicação: | 24-Set-2024 |
Referência: | FARIA, Gustavo Raspante. Desenvolvimento de um co-projeto hardware-software para uma rede convolucional para estimativa da frequência cardíaca fetal. 2024. 80 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Eletrônica)—Universidade de Brasília, Brasília, 2024. |
Resumo: | Atualmente, uma das aplicações das redes neurais artificiais é o seu uso para obter a frequência cardíaca fetal a partir do aECG materno. Dessa forma, é possível realizar a aceleração
em hardware da RNA, visando uma melhor eficiência de tempo de execução e de consumo energético. Com isso, o presente projeto consiste em utilizar a abordagem co-projeto
Hardware-Software na implementação em FPGA de uma Rede Neural Convolucional para
estimar a frequência cardíaca fetal. Inicialmente, a rede neural completa foi descrita em C e
executada como software embarcado no microprocessador ARM de um kit de desenvolvimento Zynq SoC para identificar as camadas de maior tempo de execução. Em seguida, as
camadas convolucionais que promoveram maior atraso foram implementadas em VHDL
e validadas em hardware, obtendo-se um ganho considerável de tempo em relação à implementação feita apenas em software. No caso, a segunda, a terceira e a quarta camadas
convolucionais da CNN utilizaram uma representação em ponto flutuante de 27 bits, de
modo que a segunda camada implementada em hardware acelerou em 3,25 vezes com um
EQM de 0,0001895; já a terceira camada foi acelerada em 2 vezes com um EQM de 0,0003257
e a quarta foi acelerada em 1,05 vezes com um EQM igual a 2,860758e-12, sendo que a
comparação do tempo é com um processador de frequência de clock 6,67 vezes maior. A
quarta camada convolucional implementada foi escolhida para ser encapsulada em uma IP
na interface AXI4-Stream, realizando a comunicação com o bloco de processamento do SoC
Zedboard por meio do AXI DMA. Além disso, o bloco IP obtido após o encapsulamento da
camada obteve uma performance de 455 MFLOPS/W, mostrando-se cerca de 3 vezes mais
eficiente que o próprio ARM Cortex-A9 presente na Zedboard. |
Abstract: | Currently, one of the applications of artificial neural networks is using them to obtain the
fetal heart rate from maternal aECG. This allows for hardware acceleration of the ANN,
aiming for better execution time efficiency and energy consumption. This project focuses
on using a Hardware-Software co-design approach to implement a Convolutional Neural
Network on FPGA to estimate the fetal heart rate. Initially, the complete neural network
was described in C and executed as embedded software on the ARM microprocessor of a
Zynq SoC development kit to identify the layers with the highest execution time. Subsequently, the convolutional layers that caused the most delay were implemented in VHDL
and validated in hardware, achieving a considerable time gain compared to the software-only
implementation. Specifically, the second, third, and fourth convolutional layers of the CNN
used a 27-bit floating-point representation, with the second layer implemented in hardware
accelerating by 3.25 times with an MSE of 0.0001895, the third layer accelerating by 2 times
with an MSE of 0.0003257, and the fourth layer accelerating by 1.05 times with an MSE
of 2.860758e-12, compared to a processor with a clock frequency 6.67 times higher. The
fourth convolutional layer was chosen to be encapsulated into an IP core on the AXI4-Stream
interface, communicating with the processing block of the Zedboard SoC via AXI DMA.
Additionally, the IP core obtained after encapsulating the layer achieved a performance of
455 MFLOPS/W, making it approximately 3 times more efficient than the ARM Cortex-A9
present on the Zedboard. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade UnB Gama, 2024. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia Eletrônica
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.