Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/14116
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2015_BrunoAiresdeSousa.pdf1,06 MBAdobe PDFver/abrir
Título: Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
Autor(es): Sousa, Bruno Aires de
Orientador(es): Holanda, Maristela Terto de
Assunto: NoSQL (Banco de dados)
Banco de dados
Bioinformática
Data de apresentação: 15-Dez-2015
Data de publicação: 15-Ago-2016
Referência: SOUSA, Bruno Aires de. Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB. 2015. xi, 49 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.
Resumo: Este trabalho apresenta uma análise da utilização do sistema gerenciador de banco de dados NoSQL ArangoDB em workflow de Bioinformática. O ArangoDB é um banco híbrido que possui um modelo baseado em grafo e em documento para persistência de dados. Para isso, foi realizado um estudo sobre o armazenamento de dados gerados na fases de filtragem e de mapeamento de um workflow de Bioinformática, bem como a geração de grafos de proveniência a partir dos processos utilizados. O estudo foi motivado pela possibilidade de se armazenar os dados gerados ao longo do processamento do workflow e informações sobre sua execução em um mesmo lugar, o que facilitaria a reexecução de um workflow científico, visto que não seria necessário buscar novamente os dados que foram utilizados em um dado experimento. Como resultado, este trabalho demonstra como os dados gerados pelo workflow e seus dados de proveniência foram armazenados no ArangoDB utilizando o modelo PROV-DM.
Abstract: This work presents a study about the use of the database management system NoSQL ArangoDB in Bioinformatics workflow. The ArangoDB is a database that has a hybrid model based on graph and document for data persistence. It was studied the storing of data of the filtering and mapping stages from a Bioinformatics workflow, as well the provenance graph generated by the used process. The study was motivated by the possibility of storing data generated during the processing of the workflow and data about its execution in one place, which would facilitate the re-execution of a scientific workflow, because it would not be necessary to look again the data that were used in a given experiment. As a result, this work demonstrates how the data generated by workflow and its provenance were stored on ArangoDB using the PROV-DM model.
Informações adicionais: Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.
Aparece na Coleção:Engenharia da Computação



Este item está licenciado na Licença Creative Commons Creative Commons