Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/31282
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2022_PedroVitorMizuno_tcc.pdf1,88 MBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorMelo, Alba Cristina Magalhães Alves de-
dc.contributor.authorMizuno, Pedro Vitor Valença-
dc.identifier.citationMIZUNO, Pedro Vitor Valença. Comparação paralela de sequências biológicas: otimização da área de descarte de blocos com escore heurístico. 2022. xi, 67 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2022.pt_BR
dc.descriptionTrabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.pt_BR
dc.description.abstractEste trabalho de graduação apresenta o módulo de obtenção de escore inicial heurístico adicionado à ferramenta de comparação de sequências biológicas MASA-CUDAlignMultiBP. A partir deste módulo, busca-se expandir a área de descarte de blocos da matriz de programação dinâmica ao inicializar a execução da ferramenta com o escore heurístico, obtido com o alinhador de sequências heurístico Lastz, ao contrário da inicialização original da ferramenta, cujo escore inicial é 0. O módulo foi implementado e integrado à ferramenta e, para testá-lo e coletar resultados, foi configurado um cluster de duas GPUs NVIDIA T4 Tensor Core hospedado na nuvem AWS (Amazon Web Services). Nos testes, foram feitas comparações entre sequências reais de DNA de tamanho 1M, 3M, 5M e 10M. Os resultados encontrados mostram que, para as sequências utilizadas, há uma melhora de desempenho mais significativa em comparações de sequências compridas com alta similaridade e para as quais foi obtido um escore heurístico inicial grande. Ademais, aliado ao escore inicial, também é atestada a melhora de desempenho que a mudança da distribuição de colunas da matriz entre GPUs (split) gera para ferramenta MASA-CUDAlign-MultiBP.pt_BR
dc.rightsAcesso Abertopt_BR
dc.subject.keywordSequência biológicapt_BR
dc.subject.keywordPoda (Computação)pt_BR
dc.subject.keywordUnidades de Processamento Gráfico (GPUs)pt_BR
dc.subject.keywordPlataforma de computação paralelapt_BR
dc.titleComparação paralela de sequências biológicas : otimização da área de descarte de blocos com escore heurísticopt_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2022-06-29T18:00:31Z-
dc.date.available2022-06-29T18:00:31Z-
dc.date.submitted2022-05-05-
dc.identifier.urihttps://bdm.unb.br/handle/10483/31282-
dc.language.isoPortuguêspt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.description.abstract1This undergraduate project presents a module that obtains a heuristic initial score, which was integrated to the biological sequence comparison tool MASA-CUDAlign-MultiBP. From this module, we look to expand the pruning area in the dynamic programming matrix through the tool’s initialization with the heuristic score, obtained by the heuristic sequence aligner Lastz, unlike the original initialization of the tool, which set the initial value as 0. In order to test and collect results with our module, we configured a cluster with two NVIDIA T4 Tensor Core GPUs hosted in the AWS (Amazon Web Service) cloud. Comparisons were made between real DNA sequences with of size 1M, 3M, 5M and 10M. The results obtained show that, for these sequences, there is a more significant improvement of performance in comparisons between lengthier and similar sequences for which the Lastz tool was able to obtain a larger heuristic initial score. Furthermore, combined with the initial score, it is presented the improvement of performance resulted through the change of the column distribution of the matrix between GPUs (split) to the tool MASA-CUDAlign-MultiBP.pt_BR
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.