| Título: | Atualização do uso de memória de GPU na ferramenta MASA-CUDAlign de comparação de sequências biológicas longas |
| Autor(es): | Aragão, Rafael Rodrigues Gamas Domingos de |
| Orientador(es): | Melo, Alba Cristina Magalhães Alves de |
| Assunto: | Bioinformática Algoritmos |
| Data de apresentação: | 10-Fev-2025 |
| Data de publicação: | 5-Nov-2025 |
| Referência: | ARAGÃO, Rafael Rodrigues Gamas Domingos de. Atualização do uso de memória de GPU na ferramenta MASA-CUDAlign de comparação de sequências biológicas longas. 2025. 57 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) — Universidade de Brasília, Brasília, 2025. |
| Resumo: | A comparação de sequências biológicas (DNA, RNA e proteínas) é uma operação fundamental na Bioinformática, pois permite inferir o funcionamento de genes e compreender
as relações evolutivas entre organismos. Algoritmos exatos de alinhamento, como Smith-Waterman, Gotoh e Myers-Miller, são amplamente utilizados para a realização dessa
tarefa. Para sequências muito longas, esses algoritmos demandam elevado tempo de processamento, podendo ser acelerados por meio da execução paralela em GPUs (Graphical
Processing Units). O MASA-CUDAlign é uma ferramenta capaz de comparar sequências
de DNA de tamanho irrestrito com o algoritmo exato Smith-Waterman em GPUs, sendo
a mais rápida da literatura para esse fim. Ela utiliza a plataforma CUDA da NVIDIA
para a programação de GPUs, empregando memória textura para o armazenamento das
sequências. Contudo, em 2019, a API CUDA utilizada para manipulação de referências
à textura foi descontinuada, tornando-se necessária a atualização do uso de memória de
GPU no código do MASA-CUDAlign. O objetivo deste trabalho de graduação é atualizar
o MASA-CUDAlign para torná-lo compatível com as versões mais recentes da CUDA,
substituindo o uso de memória textura por memória global, além de avaliar o impacto
dessa modificação em seu desempenho. Para isso, foram identificadas as linhas do código
que utilizavam memória textura e realizados ajustes para implementar ponteiros globais
e novas funções de manipulação de dados. A versão atualizada foi testada em duas GPUs
NVIDIA com sequências de diferentes tamanhos, e os resultados foram comparados aos
da versão original. Os experimentos mostraram que a substituição da memória textura
não apenas preservou a eficiência da ferramenta na maioria dos casos, como também melhorou o desempenho e ampliou a capacidade de processamento para sequências maiores,
confirmando a relevância da atualização realizada. |
| Abstract: | The comparison of biological sequences (DNA, RNA, and proteins) is a fundamental
operation in Bioinformatics, as it enables the inference of gene functions and the understanding of evolutionary relationships among organisms. Exact alignment algorithms,
such as Smith-Waterman, Gotoh, and Myers-Miller, are widely used for sequence comparison. However, for very long sequences, these algorithms demand high computational
power, which can be accelerated through parallel execution on GPUs (Graphics Processing
Units). MASA-CUDAlign is a tool capable of comparing DNA sequences of unrestricted
size using the exact Smith-Waterman algorithm on GPUs, and it is the fastest solution
in the literature for this purpose. This tool leverages NVIDIA’s CUDA platform for
GPU programming, using texture memory to store the sequences. However, in 2019, the
CUDA API for texture memory manipulation was deprecated, requiring an update to
the MASA-CUDAlign code. The objective of this undergraduate project is to update
MASA-CUDAlign to ensure compatibility with the latest versions of CUDA by replacing the use of texture memory with global memory and evaluating the impact of this
modification on the tool’s performance. For this purpose, the code lines using texture
memory were identified, and adjustments were made to implement global pointers and
new data manipulation functions. The updated version was tested on two NVIDIA GPUs
with sequences of varying lengths, and the results were compared to those of the original
version. The experiments showed that replacing texture memory not only preserved the
algorithm’s efficiency in most cases but also improved performance and expanded the
processing capacity for larger sequences, confirming the relevance of the update. |
| Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2025. |
| Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
| Aparece na Coleção: | Engenharia da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.