Análise de modelos de dados para NoSQL baseados em documento em workflows de bioinformática

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/27264

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2018_IngridSantanaLopes_tcc.pdf		2,83 MB	Adobe PDF	ver/abrir

Título:	Análise de modelos de dados para NoSQL baseados em documento em workflows de bioinformática
Autor(es):	Lopes, Ingrid Santana
Orientador(es):	Holanda, Maristela Terto de
Assunto:	NoSQL (Not Only SQL) Banco de dados Biologia computacional Big Data
Data de apresentação:	28-Nov-2018
Data de publicação:	19-Abr-2021
Referência:	LOPES, Ingrid Santana. Análise de modelos de dados para NoSQL baseados em documento em workflows de bioinformática. 2018. 79 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2018.
Resumo:	Para a quantidade crescente de dados gerados por várias áreas do conhecimento dá-se o nome de Big Data. Neste cenário, pode-se dizer que as pesquisas de bioinformática necessitam de dados de proveniência, pois estes são capazes de fornecer o histórico das informações coletadas no workflow da pesquisa e responder questões relacionadas à origem dos dados. Big Data trouxe o surgimento da abordagem NoSQL (Not Only SQL) como uma alternativa ao uso de Modelos de Banco de Dados Relacional por não apresentar as limitações observadas no Modelo de Banco de Dados Relacional quando este é aplicado em uma grande quantidade de dados. Com foco no MongoDB, este trabalho propõe, com o auxílio de um programa, criado capaz de executar automaticamente um workflow, armazenar sua proveniência e dados brutos em três diferentes formatos de documentos: referencial, embutido e híbrido. Essas três maneiras diferentes são comparadas e analisadas usando parâmetros como tempo e recursos de consulta. Os resultados mostraram algumas particularidades da bioinformática e vantagens ou desvantagens para cada mod- elo.
Abstract:	The increasing amount of data named generated by several areas of knowledge is named Big Data. In this scenary, it can be said that Bioinformatic researchs needs provenance data, since it is capable of providing the history of the information collected in the research workflow and answer questions related to the data source. Big Data brought the emergence of the NoSQL (Not Only SQL) approach as an alternative to the use of Relational Database Models because it does not present the limitations observed in the Relational Database Model when it is applied in a large dataset. With focus on MongoDB, this work proposes a program that can automatically execute a workflow and store its provenance and raw data into three different document formats: reference, embedded and hybrid. Those three different ways are compared using parameters such as time and query capabilities. Results showed some bioinformatics particularities and advantages or disadvantages for each model.
Informações adicionais:	Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018.
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:	Engenharia da Computação

Mostrar item em formato completo Recomendar este item Visualizar estatísticas