Título: | Execução automatizada e flexível de lotes de comparações paralelas de sequências biológicas |
Autor(es): | Andrade, Pedro Lucas Pinto |
Orientador(es): | Melo, Alba Cristina Magalhães Alves de |
Assunto: | Algoritmos Sequência biológica |
Data de apresentação: | 5-Out-2022 |
Data de publicação: | 17-Fev-2023 |
Referência: | ANDRADE, Pedro Lucas Pinto. Execução automatizada e flexível de lotes de comparações paralelas de sequências biológicas. 2022. xi, 48 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2022. |
Resumo: | Este trabalho de graduação propõe uma ferramenta para obtenção de valores de parâmetros otimizados para a execução de alinhamentos de sequências biológicas, além da execução de lotes de alinhamentos, ambos de forma automatizada, utilizando a ferramenta MASA-CUDAlign. O objetivo da ferramenta proposta é auxiliar usuários do MASA-CUDAlign fornecendo valores adequados para os parâmetros de execução, obtidos por meio de profiling, de forma a otimizar o tempo de processamento que, no caso de sequências grandes, pode chegar à horas de execução por alinhamento. Além disso, a ferramenta também tem o objetivo de auxiliar os usuários fornecendo uma forma automatizada de executar lotes de múltiplos alinhamentos, sem a necessidade de interagir com a ferramenta entre cada alinhamento, e receber os resultados de forma organizada ao final da execução. Para testar a ferramenta proposta foi utilizada uma máquina com uma GPU NVIDIA GeForce RTX 2060, para executar alinhamentos com sequências reais de DNA de tamanho 1M, 3M, 4M, 6M e 8M, utilizando os valores de parâmetros já obtidos com a ferramentas proposta por meio de um profiling. Os resultados encontrados mostram que os valores de parâmetros obtidos pela ferramenta são adequados, alcançando o melhor desempenho para a maioria das comparações testadas, e um desempenho bem melhor do que os piores valores de parâmetros testados. Além disso, a execução em lote funcionou de forma satisfatória, realizando a interface com o MASA-CUDAlign, executando os múltiplos alinhamentos e entregando os resultados de forma organizada. |
Abstract: | This undergraduate work proposes a tool to obtain optimized values for execution parameters used in the alignment of biological sequences by the MASA-CUDAlign tool, as well as to use said tool to execute batches of alignments. The objective of the proposed tool is to help MASA-CUDAlign users by supplying adequate values for the execution parameters, obtained using profiling, to optimize the processing time which, in the case of large sequences, can be of multiple hours per alignment. In addition, it also has the objective of assisting the users by providing an automated method to execute batches of alignments, without the need to interact with the tool between each alignment, and gather all the results in an organized manner after the execution is done. To test the proposed tool, we used a desktop with an NVIDIA GeForce RTX 2060 GPU to execute alignments with real DNA sequences of sizes 1M, 3M, 4M, 6M and 8M, using the parameter values already obtained by the proposed tool with profiling. The collected results show that the parameter values obtained by the tool are adequate, achieving the best performance in most of the tested comparisons and a much better performance than the worst parameter values tested. Furthermore, the batch execution worked in a satisfactory way, interfacing with the MASA-CUDAlign tool and collecting and delivering the results in an
organized manner. |
Informações adicionais: | Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.