Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/14116
Título: | Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB |
Autor(es): | Sousa, Bruno Aires de |
Orientador(es): | Holanda, Maristela Terto de |
Assunto: | NoSQL (Banco de dados) Banco de dados Bioinformática |
Data de apresentação: | 15-Dez-2015 |
Data de publicação: | 15-Ago-2016 |
Referência: | SOUSA, Bruno Aires de. Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB. 2015. xi, 49 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015. |
Resumo: | Este trabalho apresenta uma análise da utilização do sistema gerenciador de banco de
dados NoSQL ArangoDB em workflow de Bioinformática. O ArangoDB é um banco
híbrido que possui um modelo baseado em grafo e em documento para persistência de
dados. Para isso, foi realizado um estudo sobre o armazenamento de dados gerados na fases
de filtragem e de mapeamento de um workflow de Bioinformática, bem como a geração
de grafos de proveniência a partir dos processos utilizados. O estudo foi motivado pela
possibilidade de se armazenar os dados gerados ao longo do processamento do workflow
e informações sobre sua execução em um mesmo lugar, o que facilitaria a reexecução de
um workflow científico, visto que não seria necessário buscar novamente os dados que
foram utilizados em um dado experimento. Como resultado, este trabalho demonstra
como os dados gerados pelo workflow e seus dados de proveniência foram armazenados
no ArangoDB utilizando o modelo PROV-DM. |
Abstract: | This work presents a study about the use of the database management system NoSQL
ArangoDB in Bioinformatics workflow. The ArangoDB is a database that has a hybrid
model based on graph and document for data persistence. It was studied the storing of
data of the filtering and mapping stages from a Bioinformatics workflow, as well the provenance
graph generated by the used process. The study was motivated by the possibility of
storing data generated during the processing of the workflow and data about its execution
in one place, which would facilitate the re-execution of a scientific workflow, because it
would not be necessary to look again the data that were used in a given experiment. As
a result, this work demonstrates how the data generated by workflow and its provenance
were stored on ArangoDB using the PROV-DM model. |
Informações adicionais: | Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015. |
Aparece na Coleção: | Engenharia da Computação
|
Este item está licenciado na Licença Creative Commons