Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/28921
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2019_RafaelNeivaDaCunha_tcc.pdf2,15 MBAdobe PDFver/abrir
Título: Avaliação de estratégias Alignment-free para determinar o fator de pruning em comparação paralela de sequências
Autor(es): Cunha, Rafael Neiva da
Orientador(es): Melo, Alba Cristina Magalhães Alves de
Assunto: Programação paralela (Computação)
Biologia computacional
Bioinformática
Data de apresentação: 9-Jul-2019
Data de publicação: 15-Out-2021
Referência: CUNHA, Rafael Neiva da. Avaliação de estratégias Alignment-free para determinar o fator de pruning em comparação paralela de sequências. 2019. 55 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019.
Resumo: A Bioinformática tem como uma de suas principais operações a comparação entre se- quências biológicas. Através de métodos exatos baseados no alinhamento, são obtidos resultados ótimos, porém o tempo para obtenção desses alinhamentos é muito grande. Com a adição da técnica de block pruning, o tempo pode ser bastante reduzido. Porém, no block pruning a área de poda é obtida ao longo da execução do alinhamento. Para determinar o tempo de execução de uma comparação com pruning antes do alinhamento existe uma regressão multi-linear. No entanto, essa fórmula requer que o fator de block pruning seja conhecido antes da execução da comparação, o que não acontece. O presente trabalho de graduação tem como objetivo analisar algoritmos que fazem a comparação sem se basear no alinhamento, alignment-free, e que são executados rapidamente, com o objetivo de utilizá-los para gerar os valores de block pruning antes do alinhamento das sequências. Os resultados da análise de diferentes algoritmos mostraram que a ferramenta ALF-N2 (ALignment-Free framework), através de seu algoritmo N2, apresenta resultados satisfatórios para a geração de uma correlação entre o fator de block pruning e a simila- ridade entre as sequências por meio do alignment-free. Usando a estratégia proposta no presente trabalho de graduação, conseguimos obter taxas de block pruning com muito boa acurácia, apresentando erros de até 7,0% para sequências pequenas e 3,7% para sequências maiores.
Abstract: Sequence comparison is one of the most basic operations in Bioinformatics. With alignment- based exact methods it is possible to obtain very good results, but these methods require huge execution times, when the sequences are long. Block pruning is an optimization that may reduce considerably the execution times if the sequences involved have high similarity. In order to predict execution times of comparisons with pruning, a multiple re- gression formula was proposed. However, this formula requires that the block pruning rate is known before the comparison, which is not the case, since the pruned area is computed during the alignment process. This graduation project evaluates different alignment-free algorithms that execute much faster than the exact methods, with the goal to generate block pruning values before the sequences alignment itself. The results of the evaluation of various algorithms showed that the ALF-N2 tool provided very good results using its algorithm N2. With the ALF-N2 tool, we were able to generate a correlation between block pruning percentages and sequences similarity. Using the proposed strategy, we were able to obtain block pruning rates that are very close to the real ones, with maximum error rates of 7.0% for small sequences and 3.7% for longer ones.
Informações adicionais: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.