Campo Dublin Core | Valor | Língua |
dc.contributor.advisor | Melo, Alba Cristina Magalhães Alves de | - |
dc.contributor.author | Cunha, Rafael Neiva da | - |
dc.identifier.citation | CUNHA, Rafael Neiva da. Avaliação de estratégias Alignment-free para determinar o fator de pruning em comparação paralela de sequências. 2019. 55 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019. | pt_BR |
dc.description | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019. | pt_BR |
dc.description.abstract | A Bioinformática tem como uma de suas principais operações a comparação entre se-
quências biológicas. Através de métodos exatos baseados no alinhamento, são obtidos
resultados ótimos, porém o tempo para obtenção desses alinhamentos é muito grande.
Com a adição da técnica de block pruning, o tempo pode ser bastante reduzido. Porém,
no block pruning a área de poda é obtida ao longo da execução do alinhamento. Para
determinar o tempo de execução de uma comparação com pruning antes do alinhamento
existe uma regressão multi-linear. No entanto, essa fórmula requer que o fator de block
pruning seja conhecido antes da execução da comparação, o que não acontece. O presente
trabalho de graduação tem como objetivo analisar algoritmos que fazem a comparação
sem se basear no alinhamento, alignment-free, e que são executados rapidamente, com o
objetivo de utilizá-los para gerar os valores de block pruning antes do alinhamento das
sequências. Os resultados da análise de diferentes algoritmos mostraram que a ferramenta
ALF-N2 (ALignment-Free framework), através de seu algoritmo N2, apresenta resultados
satisfatórios para a geração de uma correlação entre o fator de block pruning e a simila-
ridade entre as sequências por meio do alignment-free. Usando a estratégia proposta no
presente trabalho de graduação, conseguimos obter taxas de block pruning com muito boa
acurácia, apresentando erros de até 7,0% para sequências pequenas e 3,7% para sequências
maiores. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject.keyword | Programação paralela (Computação) | pt_BR |
dc.subject.keyword | Biologia computacional | pt_BR |
dc.subject.keyword | Bioinformática | pt_BR |
dc.title | Avaliação de estratégias Alignment-free para determinar o fator de pruning em comparação paralela de sequências | pt_BR |
dc.type | Trabalho de Conclusão de Curso - Graduação - Bacharelado | pt_BR |
dc.date.accessioned | 2021-10-15T15:14:31Z | - |
dc.date.available | 2021-10-15T15:14:31Z | - |
dc.date.submitted | 2019-07-09 | - |
dc.identifier.uri | https://bdm.unb.br/handle/10483/28921 | - |
dc.language.iso | Português | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. | pt_BR |
dc.description.abstract1 | Sequence comparison is one of the most basic operations in Bioinformatics. With alignment-
based exact methods it is possible to obtain very good results, but these methods require
huge execution times, when the sequences are long. Block pruning is an optimization
that may reduce considerably the execution times if the sequences involved have high
similarity. In order to predict execution times of comparisons with pruning, a multiple re-
gression formula was proposed. However, this formula requires that the block pruning rate
is known before the comparison, which is not the case, since the pruned area is computed
during the alignment process. This graduation project evaluates different alignment-free
algorithms that execute much faster than the exact methods, with the goal to generate
block pruning values before the sequences alignment itself. The results of the evaluation
of various algorithms showed that the ALF-N2 tool provided very good results using its
algorithm N2. With the ALF-N2 tool, we were able to generate a correlation between
block pruning percentages and sequences similarity. Using the proposed strategy, we were
able to obtain block pruning rates that are very close to the real ones, with maximum
error rates of 7.0% for small sequences and 3.7% for longer ones. | pt_BR |
Aparece na Coleção: | Engenharia da Computação
|