Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39970
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2024_GustavoRaspanteFaria_tcc.pdf4,54 MBAdobe PDFver/abrir
Título: Desenvolvimento de um co-projeto hardware-software para uma rede convolucional para estimativa da frequência cardíaca fetal
Autor(es): Faria, Gustavo Raspante
Orientador(es): Beserra, Gilmar Silva
Assunto: FPGAs (Field Programmable Gate Arrays)
Redes neurais convolucionais (Computação)
VHDL (Linguagem descritiva de hardware)
Frequência cardíaca fetal (FHR)
Data de apresentação: 12-Jul-2024
Data de publicação: 24-Set-2024
Referência: FARIA, Gustavo Raspante. Desenvolvimento de um co-projeto hardware-software para uma rede convolucional para estimativa da frequência cardíaca fetal. 2024. 80 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Eletrônica)—Universidade de Brasília, Brasília, 2024.
Resumo: Atualmente, uma das aplicações das redes neurais artificiais é o seu uso para obter a frequência cardíaca fetal a partir do aECG materno. Dessa forma, é possível realizar a aceleração em hardware da RNA, visando uma melhor eficiência de tempo de execução e de consumo energético. Com isso, o presente projeto consiste em utilizar a abordagem co-projeto Hardware-Software na implementação em FPGA de uma Rede Neural Convolucional para estimar a frequência cardíaca fetal. Inicialmente, a rede neural completa foi descrita em C e executada como software embarcado no microprocessador ARM de um kit de desenvolvimento Zynq SoC para identificar as camadas de maior tempo de execução. Em seguida, as camadas convolucionais que promoveram maior atraso foram implementadas em VHDL e validadas em hardware, obtendo-se um ganho considerável de tempo em relação à implementação feita apenas em software. No caso, a segunda, a terceira e a quarta camadas convolucionais da CNN utilizaram uma representação em ponto flutuante de 27 bits, de modo que a segunda camada implementada em hardware acelerou em 3,25 vezes com um EQM de 0,0001895; já a terceira camada foi acelerada em 2 vezes com um EQM de 0,0003257 e a quarta foi acelerada em 1,05 vezes com um EQM igual a 2,860758e-12, sendo que a comparação do tempo é com um processador de frequência de clock 6,67 vezes maior. A quarta camada convolucional implementada foi escolhida para ser encapsulada em uma IP na interface AXI4-Stream, realizando a comunicação com o bloco de processamento do SoC Zedboard por meio do AXI DMA. Além disso, o bloco IP obtido após o encapsulamento da camada obteve uma performance de 455 MFLOPS/W, mostrando-se cerca de 3 vezes mais eficiente que o próprio ARM Cortex-A9 presente na Zedboard.
Abstract: Currently, one of the applications of artificial neural networks is using them to obtain the fetal heart rate from maternal aECG. This allows for hardware acceleration of the ANN, aiming for better execution time efficiency and energy consumption. This project focuses on using a Hardware-Software co-design approach to implement a Convolutional Neural Network on FPGA to estimate the fetal heart rate. Initially, the complete neural network was described in C and executed as embedded software on the ARM microprocessor of a Zynq SoC development kit to identify the layers with the highest execution time. Subsequently, the convolutional layers that caused the most delay were implemented in VHDL and validated in hardware, achieving a considerable time gain compared to the software-only implementation. Specifically, the second, third, and fourth convolutional layers of the CNN used a 27-bit floating-point representation, with the second layer implemented in hardware accelerating by 3.25 times with an MSE of 0.0001895, the third layer accelerating by 2 times with an MSE of 0.0003257, and the fourth layer accelerating by 1.05 times with an MSE of 2.860758e-12, compared to a processor with a clock frequency 6.67 times higher. The fourth convolutional layer was chosen to be encapsulated into an IP core on the AXI4-Stream interface, communicating with the processing block of the Zedboard SoC via AXI DMA. Additionally, the IP core obtained after encapsulating the layer achieved a performance of 455 MFLOPS/W, making it approximately 3 times more efficient than the ARM Cortex-A9 present on the Zedboard.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade UnB Gama, 2024.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia Eletrônica



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.