Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34473
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_GabrielLins_tcc.pdfTrabalho de Conclusão de Curso 4,32 MBAdobe PDFver/abrir
Título: Aprendizado de máquina aplicado em cluster Kubernetes para dispositivos de baixo custo
Autor(es): Lins, Gabriel
Orientador(es): Nery, Alexandre Solon
Assunto: Aprendizado de máquina
Redes neurais (Computação)
Data de apresentação: Mai-2021
Data de publicação: 6-Abr-2023
Referência: LINS, Gabriel. Aprendizado de máquina aplicado em cluster Kubernetes para dispositivos de baixo custo. 2021. 69 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia de Redes de Comunicação) — Universidade de Brasília, Brasília, 2021.
Resumo: Diante da crescente aplicação do machine learning para auxilio em diversas áreas e a quantidade de dados cada vez maior, barreiras relacionadas ao poder computacional foram construídas e hoje, tornam todo o processo bastante oneroso. O grande custo e a sustentabilidade têm sido impulsionadores para que novas alternativas sejam desenvolvidas e estudadas. Nesse contexto, pesquisas e aplicações relacionadas a Model Parallelism e Data Parallelism ganharam uma notável importância e uma valiosa contribuição para tornar a aplicação do aprendizado de máquina presente em um maior número de ambientes e por um maior número de pessoas. Neste trabalho, métricas estatísticas que permitem analisar o desempenho e o resultado obtido entre a solução usual e a solução proposta serão apresentadas, tornando possível uma avaliação profunda do trade off realizado entre os parâmetros intrinsecamente ligados. Para avaliar o consumo energético por parte dos dispositivos, execuções serão realizadas em dois tipos de dispositivos: em dispositivos Raspberry Pi 4 modelo B e em máquinas virtuais. A solução desenvolvida, baseado na construção de um cluster Kubernetes utilizando Raspberry Pi, busca além de oferecer menor custo no processo de treinamento e inferência do machine learning, uma maior eficiência de energia. A distribuição de Kubernetes utilizada nesse estudo foi a oferecida pela Rancher Labs, K3s, voltada para dispositivos de baixo custo. Com o intuito de ser mais leve que as demais distribuições, é possível utilizar o benefício oferecido pelo Kubernetes sem que haja uma sobrecarga nos dispositivos. Durante o trabalho, pipelines de aprendizado de máquinas foram implementados e testados. Utilizando a ferramenta Kubeflow, foi construído um ambiente integrado ao Kubernetes voltado para o aprendizado de máquinas. Com essa arquitetura construída, foi possível mensurar elementos como uso de memória, CPU, temperatura e consumo energético e assim, estabelecer métodos para avaliar a utilização de dispositivos Raspberry Pi com processamento ARM em etapas de treinamento e inferência de um modelo genérico. Para compor a pesquisa, foram utilizados ferramentas open-source que auxiliam em todo as etapas do aprendizado de máquinas. A solução de storage escolhida foi o LongHorn, para monitoramento foi utilizado painéis do Grafana facilmente instalados através do Rancher. Para prover o cluster, foi utilizado o K3s e o ambiente de aprendizado de máquinas dá-se na ferramenta Kube flow
Abstract: In view of the increasing of machine learning in different areas and the increasing amount of data, barriers related to computational power were built and today, the whole process is quite costly. The high cost and sustainability have been boosters to study and develop new alternatives. In this context, research and applications related to “Model Parallelism” and “Data Parallelism” gained notable importance and a valuable contribution to making the application of machine learning present in a greater number of environments and by a greater number of people. In this work, statistical metrics that allow to analyze the performance and the result obtained between the usual solution and the proposed solution will be presented, making possible an in-depth assessment of the trade off carried out between the intrinsically linked parameters. The developed solution, based on the construction of a Kubernetes cluster using Raspberry Pi, seeks in addition to offering lower cost in the training process and inference from machine learning, greater energy efficiency. During the work, machine learning pipelines were implemented and tested. Using the Kubeflow tool, an integrated environment for Kubernetes aimed at machine learning was built. With this built architecture, it was possible to measure elements such as memory usage, CPU, temperature and energy consumption and, thus, establish methods to evaluate the use of Raspberry Pi ARM processing devices in stages of training and inference of a generic model. To build the research, were used open-source tools that assist in all stages of machine lear ning. The storage solution chosen was LongHorn, for monitoring, Grafana panels were used, easily installed through the Rancher. To provide the cluster, K3s were used and the machine learning environment takes place in the Kubeflow tool.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2021.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia de Redes de Comunicação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.