Título: | Mecanismo de parada síncrona para comparação paralela de sequências biológicas longas em ambientes heterogêneos |
Autor(es): | Nanami, Eduardo Shindi Oliveira, Jadiel Teófilo Amorim de |
Orientador(es): | Melo, Alba Cristina Magalhães Alves de |
Assunto: | Bioinformática Biologia computacional Processamento eletrônico de dados |
Data de apresentação: | 6-Jul-2018 |
Data de publicação: | 30-Abr-2019 |
Referência: | NANAMI, Eduardo Shindi; OLIVEIRA, Jadiel Teófilo Amorim de. Mecanismo de parada síncrona para comparação paralela de sequências biológicas longas em ambientes heterogêneos. 2018. 67 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2017. |
Resumo: | Na Bioinformática, uma das operações mais básicas para a análise de sequências biológicas
é o alinhamento das sequências. Essa operação, ao ser realizada utilizando algoritmos
exatos, leva tempo quadrático, e por isso pode levar muitas horas no alinhamento de sequências
muito longas. O MASA é uma das ferramentas que realiza tal operação, e para
isso pode utilizar vários nós de processamento, para os quais, atualmente, distribui estaticamente
a carga. Fatores como a realização da operação de Block Pruning e a utilização
concorrente de recursos com outros processos nos nós podem levar a um desbalanceamento
de carga ao longo da execução, o que resulta em um congestionamento dos buffers
entre os nós e consequentemente a um processamento mais lento. Para que seja possível o
balanceamento dinâmico de carga, é necessária a parada da operação de alinhamento de
todos os nós. No presente trabalho de graduação foi projetado, implementado e avaliado
um mecanismo de parada sincronizada dos nós da arquitetura MASA. O mecanismo projetado
consiste de um módulo de checkpoint que estabelece a conexão inicial entre os nós
e em um determinado momento da execução para os nós de forma sincronizada. Nessa
operação os nós decidem uma linha em comum da matriz de alinhamento, a partir da qual
a operação será retornada na reinicialização. O overhead introduzido à arquitetura MASA
pela adição do módulo de checkpoint foi avaliado em um ambiente controlado composto
por três nós com uma GPU cada e se mostrou bastante pequeno em relação ao tempo
total de execução da aplicação, com tempos variando de 1 a 2 segundos em execuções de
até 1 hora e 9 minutos. |
Abstract: | One of the most basic operations in Bioinformatics for the biological sequence analysis
is the alignment of sequences. This operation, if executed using exact algorithms, takes
a quadratic execution time, and hence, can take many hours on the alignment of very
large sequences. MASA is one of the tools that are able to perform this operation and,
in order to achieve that, it may utilize of many processing nodes, statically assigning the
load. Factors like the utilization of the Block Pruning operation and the concurrent use of
resources with other processes on the processing nodes may lead to a unbalanced distribution
of loads, resulting on a buffer overload and consequently to a worsened performance.
To enable the execution of a load balancing a alignment stop operation in all nodes is
needed. In the current undergraduate thesis, a mechanism of synchronous stop for the
MASA architecture was designed, implemented and evaluated. The designed mechanism
consists of a checkpoint module which lays down a connection between the nodes and,
when needed, stops all nodes in a synchronized manner. In this stopping operation, the
nodes decide on a unique a row on the alignment matrix from which the operation will
resume. The overhead of the implemented module on the MASA architecture was evaluated
on a controlled environment formed by three nodes with one GPU each and turned
out to be rather small compared to the full execution time of the application. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018. |
Aparece na Coleção: | Ciência da Computação
|