Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/21939
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2018_EduardoNanami_JadielTeofiloDeOliveira_tcc.pdf4,14 MBAdobe PDFver/abrir
Título: Mecanismo de parada síncrona para comparação paralela de sequências biológicas longas em ambientes heterogêneos
Autor(es): Nanami, Eduardo Shindi
Oliveira, Jadiel Teófilo Amorim de
Orientador(es): Melo, Alba Cristina Magalhães Alves de
Assunto: Bioinformática
Biologia computacional
Processamento eletrônico de dados
Data de apresentação: 6-Jul-2018
Data de publicação: 30-Abr-2019
Referência: NANAMI, Eduardo Shindi; OLIVEIRA, Jadiel Teófilo Amorim de. Mecanismo de parada síncrona para comparação paralela de sequências biológicas longas em ambientes heterogêneos. 2018. 67 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2017.
Resumo: Na Bioinformática, uma das operações mais básicas para a análise de sequências biológicas é o alinhamento das sequências. Essa operação, ao ser realizada utilizando algoritmos exatos, leva tempo quadrático, e por isso pode levar muitas horas no alinhamento de sequências muito longas. O MASA é uma das ferramentas que realiza tal operação, e para isso pode utilizar vários nós de processamento, para os quais, atualmente, distribui estaticamente a carga. Fatores como a realização da operação de Block Pruning e a utilização concorrente de recursos com outros processos nos nós podem levar a um desbalanceamento de carga ao longo da execução, o que resulta em um congestionamento dos buffers entre os nós e consequentemente a um processamento mais lento. Para que seja possível o balanceamento dinâmico de carga, é necessária a parada da operação de alinhamento de todos os nós. No presente trabalho de graduação foi projetado, implementado e avaliado um mecanismo de parada sincronizada dos nós da arquitetura MASA. O mecanismo projetado consiste de um módulo de checkpoint que estabelece a conexão inicial entre os nós e em um determinado momento da execução para os nós de forma sincronizada. Nessa operação os nós decidem uma linha em comum da matriz de alinhamento, a partir da qual a operação será retornada na reinicialização. O overhead introduzido à arquitetura MASA pela adição do módulo de checkpoint foi avaliado em um ambiente controlado composto por três nós com uma GPU cada e se mostrou bastante pequeno em relação ao tempo total de execução da aplicação, com tempos variando de 1 a 2 segundos em execuções de até 1 hora e 9 minutos.
Abstract: One of the most basic operations in Bioinformatics for the biological sequence analysis is the alignment of sequences. This operation, if executed using exact algorithms, takes a quadratic execution time, and hence, can take many hours on the alignment of very large sequences. MASA is one of the tools that are able to perform this operation and, in order to achieve that, it may utilize of many processing nodes, statically assigning the load. Factors like the utilization of the Block Pruning operation and the concurrent use of resources with other processes on the processing nodes may lead to a unbalanced distribution of loads, resulting on a buffer overload and consequently to a worsened performance. To enable the execution of a load balancing a alignment stop operation in all nodes is needed. In the current undergraduate thesis, a mechanism of synchronous stop for the MASA architecture was designed, implemented and evaluated. The designed mechanism consists of a checkpoint module which lays down a connection between the nodes and, when needed, stops all nodes in a synchronized manner. In this stopping operation, the nodes decide on a unique a row on the alignment matrix from which the operation will resume. The overhead of the implemented module on the MASA architecture was evaluated on a controlled environment formed by three nodes with one GPU each and turned out to be rather small compared to the full execution time of the application.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018.
Aparece na Coleção:Ciência da Computação



Este item está licenciado na Licença Creative Commons Creative Commons