Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/7927
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2014_RodrigoCardosoAniceto_ReneFreireXavier.pdf1,8 MBAdobe PDFver/abrir
Título: Um estudo sobre a utilização do banco de dados NoSQL cassandra em dados biológicos
Autor(es): Aniceto, Rodrigo Cardoso
Xavier, Renê Freire
Orientador(es): Holanda, Maristela Terto de
Assunto: Banco de dados
Armazenamento de dados
Biologia computacional
Computação em nuvem
Data de apresentação: 27-Fev-2014
Data de publicação: 22-Jul-2014
Referência: ANICETO, Rodrigo Cardoso; XAVIER, Renê Freire. Um estudo sobre a utilização do banco de dados NoSQL cassandra em dados biológicos. 2014. viii, 50 f., il. Monografia (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2014.
Resumo: Por meio do avanço das tecnologias voltadas a escalabilidade de um banco de dados, o uso de bancos voltados a performance que administram uma massiva quantidade de dados tornou-se mais acessível. Esses bancos de dados são conhecidos como bancos NoSQL, e são um novo paradigma computacional. De forma teórica, este trabalho apresenta vantagens e desvantagens desses bancos e aprofunda-se em caraterísticas do Cassandra. Em termos práticos, tendo em vista que os dados gerados pela bioinformática são de grande volume e necessitam de um armazenamento de alta performance, esse trabalho propõe o armazenamento destes dados no banco NoSQL Cassandra. Para isto foram realizados dois estudos de caso, um com duas e outro com quatro máquinas trabalhando em um mesmo banco do Cassandra. Estes estudos mostraram um avanço ao escalar os recursos físicos do banco, tornando a inserção e a consulta mais eficientes, sendo este uma alternativa para dar suporte aos projetos na área de bioinformática. ________________________________________________________________________ ABSTRACT
Through the advancement of technologies focused on the scalability of a database, the use of databases oriented to performance that manage massive amounts of data has become more accessible. These databases are known as NoSQL, and are a new computing paradigm. This work presents advantages and disadvantages of these NoSQL databases and delves into features of Cassandra. In the practical part, given that the data generated by bioinformatics are a large volume and need a high-performance storage, this work proposes the storage of such data in a NoSQL database, Cassandra. It were made two case studies, one with two machines working on the same database of Cassandra and the other with four machines working similarly the first one. These studies showed an improvement in scaling the physical resources of the database, making more eficient operations on the database, working as an alternative to support researches in the field of bioinformatics.
Informações adicionais: Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2014.
Aparece na Coleção:Ciência da Computação



Este item está licenciado na Licença Creative Commons Creative Commons