Título: | Aprendizado de máquina aplicado em cluster Kubernetes para dispositivos de baixo custo |
Autor(es): | Lins, Gabriel |
Orientador(es): | Nery, Alexandre Solon |
Assunto: | Aprendizado de máquina Redes neurais (Computação) |
Data de apresentação: | Mai-2021 |
Data de publicação: | 6-Abr-2023 |
Referência: | LINS, Gabriel. Aprendizado de máquina aplicado em cluster Kubernetes para dispositivos de baixo custo. 2021. 69 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia de Redes de Comunicação) — Universidade de Brasília, Brasília, 2021. |
Resumo: | Diante da crescente aplicação do machine learning para auxilio em diversas áreas e a quantidade
de dados cada vez maior, barreiras relacionadas ao poder computacional foram construídas e
hoje, tornam todo o processo bastante oneroso. O grande custo e a sustentabilidade têm sido
impulsionadores para que novas alternativas sejam desenvolvidas e estudadas. Nesse contexto,
pesquisas e aplicações relacionadas a Model Parallelism e Data Parallelism ganharam uma notável
importância e uma valiosa contribuição para tornar a aplicação do aprendizado de máquina presente
em um maior número de ambientes e por um maior número de pessoas.
Neste trabalho, métricas estatísticas que permitem analisar o desempenho e o resultado obtido
entre a solução usual e a solução proposta serão apresentadas, tornando possível uma avaliação profunda do trade off realizado entre os parâmetros intrinsecamente ligados. Para avaliar o consumo
energético por parte dos dispositivos, execuções serão realizadas em dois tipos de dispositivos: em
dispositivos Raspberry Pi 4 modelo B e em máquinas virtuais.
A solução desenvolvida, baseado na construção de um cluster Kubernetes utilizando Raspberry
Pi, busca além de oferecer menor custo no processo de treinamento e inferência do machine learning,
uma maior eficiência de energia. A distribuição de Kubernetes utilizada nesse estudo foi a oferecida
pela Rancher Labs, K3s, voltada para dispositivos de baixo custo. Com o intuito de ser mais leve
que as demais distribuições, é possível utilizar o benefício oferecido pelo Kubernetes sem que haja
uma sobrecarga nos dispositivos.
Durante o trabalho, pipelines de aprendizado de máquinas foram implementados e testados.
Utilizando a ferramenta Kubeflow, foi construído um ambiente integrado ao Kubernetes voltado
para o aprendizado de máquinas. Com essa arquitetura construída, foi possível mensurar elementos
como uso de memória, CPU, temperatura e consumo energético e assim, estabelecer métodos
para avaliar a utilização de dispositivos Raspberry Pi com processamento ARM em etapas de
treinamento e inferência de um modelo genérico.
Para compor a pesquisa, foram utilizados ferramentas open-source que auxiliam em todo as
etapas do aprendizado de máquinas. A solução de storage escolhida foi o LongHorn, para monitoramento foi utilizado painéis do Grafana facilmente instalados através do Rancher. Para prover o
cluster, foi utilizado o K3s e o ambiente de aprendizado de máquinas dá-se na ferramenta Kube flow |
Abstract: | In view of the increasing of machine learning in different areas and the increasing amount of
data, barriers related to computational power were built and today, the whole process is quite
costly. The high cost and sustainability have been boosters to study and develop new alternatives.
In this context, research and applications related to “Model Parallelism” and “Data Parallelism”
gained notable importance and a valuable contribution to making the application of machine
learning present in a greater number of environments and by a greater number of people.
In this work, statistical metrics that allow to analyze the performance and the result obtained
between the usual solution and the proposed solution will be presented, making possible an in-depth
assessment of the trade off carried out between the intrinsically linked parameters.
The developed solution, based on the construction of a Kubernetes cluster using Raspberry Pi,
seeks in addition to offering lower cost in the training process and inference from machine learning,
greater energy efficiency.
During the work, machine learning pipelines were implemented and tested. Using the Kubeflow
tool, an integrated environment for Kubernetes aimed at machine learning was built. With this
built architecture, it was possible to measure elements such as memory usage, CPU, temperature
and energy consumption and, thus, establish methods to evaluate the use of Raspberry Pi ARM
processing devices in stages of training and inference of a generic model.
To build the research, were used open-source tools that assist in all stages of machine lear ning. The storage solution chosen was LongHorn, for monitoring, Grafana panels were used, easily
installed through the Rancher. To provide the cluster, K3s were used and the machine learning
environment takes place in the Kubeflow tool. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade de Tecnologia, 2021. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia de Redes de Comunicação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.