Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/11335
Título: | Desenvolvimento de software no contexto Big Data |
Autor(es): | Bernardes, Guilherme de Lima |
Orientador(es): | Cruz, Fernando William |
Assunto: | Big Data Hadoop |
Data de apresentação: | 2015 |
Data de publicação: | 4-Nov-2015 |
Referência: | BERNARDES, Guilherme de Lima. Desenvolvimento de software no contexto Big Data. 95 f., il. Monografia (Bacharelado em Engenharia de Software)—Universidade de Brasília, Brasília, 2015. |
Resumo: | O armazenamento de informações em formato digital tem crescido consideravelmente nos últimos anos. Não apenas pessoas são responsáveis por produzir dados, equipamentos eletrônicos também se tornaram grandes geradores de registros, como servidores, aparelhos de GPS, microcomputadores espalhados nos mais variados contextos, entre uma infinidade de aplicações. O termo Big Data se refere a toda esta quantidade de dados que se encontra na ordem de petabytes e não pode ser analisada pelos métodos tradicionais. Neste trabalho, apresenta-se um estudo sobre uma das mais conhecidas arquiteturas para solucionar esses problemas, o software Hadoop. O desenvolvimento para o paradigma MapReduce é abordado, assim como os projetos que são construídos no topo do sistema Hadoop, provendo serviços em um nível de abstração maior. Além da etapa de pesquisa, uma arquitetura de aplicação Big Data voltada para um estudo de caso real é definida e implementada, a qual envolve a extração e análise de publicações de redes sociais com foco na política brasileira. |
Abstract: | The storage of information in digital format has grown considerably in recent years. Not only people are responsible for producing data, electronic equipment have also become major generators of records, such as servers, GPS devices, computers scattered in various contexts, among a multitude of applications. The term Big Data refers to all this amount of data that is on the order of petabytes and can not be analyzed by traditional methods. In this paper, we present a study of one of the most known architectures to solve these problems, Hadoop software. The development MapReduce paradigm is discussed, as well as designs that are built on top of Hadoop system providing service at a higher abstraction level. Beyond the research stage, an Big Data application architecture facing a real case study is defined and implemented, which involves the extraction and analysis of social networking publications focusing on Brazilian politics. |
Informações adicionais: | Monografia (graduação)—Universidade de Brasília, Faculdade UnB Gama, Curso de Engenharia de Software, 2015. |
Aparece na Coleção: | Engenharia de Software
|
Este item está licenciado na Licença Creative Commons