Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Melo, Alba Cristina Magalhães Alves de | - |
dc.contributor.author | Mizuno, Pedro Vitor Valença | - |
dc.identifier.citation | MIZUNO, Pedro Vitor Valença. Comparação paralela de sequências biológicas: otimização da área de descarte de blocos com escore heurístico. 2022. xi, 67 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2022. | pt_BR |
dc.description | Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022. | pt_BR |
dc.description.abstract | Este trabalho de graduação apresenta o módulo de obtenção de escore inicial heurístico adicionado à ferramenta de comparação de sequências biológicas MASA-CUDAlignMultiBP. A partir deste módulo, busca-se expandir a área de descarte de blocos da matriz de programação dinâmica ao inicializar a execução da ferramenta com o escore heurístico, obtido com o alinhador de sequências heurístico Lastz, ao contrário da inicialização original da ferramenta, cujo escore inicial é 0. O módulo foi implementado e integrado à ferramenta e, para testá-lo e coletar resultados, foi configurado um cluster de duas GPUs NVIDIA T4 Tensor Core hospedado na nuvem AWS (Amazon Web Services). Nos testes, foram feitas comparações entre sequências reais de DNA de tamanho 1M, 3M, 5M e 10M. Os resultados encontrados mostram que, para as sequências utilizadas, há uma melhora de desempenho mais significativa em comparações de sequências compridas com alta similaridade e para as quais foi obtido um escore heurístico inicial grande. Ademais, aliado ao escore inicial, também é atestada a melhora de desempenho que a mudança da distribuição de colunas da matriz entre GPUs (split) gera para ferramenta MASA-CUDAlign-MultiBP. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Sequência biológica | pt_BR |
dc.subject.keyword | Poda (Computação) | pt_BR |
dc.subject.keyword | Unidades de Processamento Gráfico (GPUs) | pt_BR |
dc.subject.keyword | Plataforma de computação paralela | pt_BR |
dc.title | Comparação paralela de sequências biológicas : otimização da área de descarte de blocos com escore heurístico | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2022-06-29T18:00:31Z | - |
dc.date.available | 2022-06-29T18:00:31Z | - |
dc.date.submitted | 2022-05-05 | - |
dc.identifier.uri | https://bdm.unb.br/handle/10483/31282 | - |
dc.language.iso | Português | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. | pt_BR |
dc.description.abstract1 | This undergraduate project presents a module that obtains a heuristic initial score, which was integrated to the biological sequence comparison tool MASA-CUDAlign-MultiBP. From this module, we look to expand the pruning area in the dynamic programming matrix through the tool’s initialization with the heuristic score, obtained by the heuristic sequence aligner Lastz, unlike the original initialization of the tool, which set the initial value as 0. In order to test and collect results with our module, we configured a cluster with two NVIDIA T4 Tensor Core GPUs hosted in the AWS (Amazon Web Service) cloud. Comparisons were made between real DNA sequences with of size 1M, 3M, 5M and 10M. The results obtained show that, for these sequences, there is a more significant improvement of performance in comparisons between lengthier and similar sequences for which the Lastz tool was able to obtain a larger heuristic initial score. Furthermore, combined with the initial score, it is presented the improvement of performance resulted through the change of the column distribution of the matrix between GPUs (split) to the tool MASA-CUDAlign-MultiBP. | pt_BR |
Aparece na Coleção: | Ciência da Computação
|