| Título: | Arquitetura de Data Fabric para armazenamento e processamento de imagens de câncer de pele |
| Autor(es): | Hannan, Abdul Barbosa, Heitor Marques Simões |
| Orientador(es): | Aguiar, Carla Silva Rocha |
| Assunto: | Câncer de pele Imagens - análise Banco de dados |
| Data de apresentação: | 29-Jul-2025 |
| Data de publicação: | 22-Jan-2026 |
| Referência: | HANNAN, Abdul; BARBOSA, Heitor Marques Simões. Arquitetura de Data Fabric para armazenamento e processamento de imagens de câncer de pele. 2025. 93 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2025. |
| Resumo: | A fragmentação de dados médicos em sistemas de saúde, aliada à crescente produção de imagens dermatológicas, impõe desafios à integração, segurança e escalabilidade na gestão dessas informações. Este trabalho investiga a aplicação de uma arquitetura Data Fabric como solução para otimizar o armazenamento, o processamento e o compartilhamento de imagens de câncer de pele, promovendo interoperabilidade e governança centralizada. A proposta é fundamentada em revisão bibliográfica e estruturada por meio de um estudo de caso, que analisa os requisitos, desafios e potenciais benefícios da adoção desse modelo no
contexto clínico. A arquitetura desenvolvida integra múltiplas fontes heterogêneas de dados, utilizando MinIO para armazenamento distribuído em camadas (bronze, silver, gold), Delta Lake para controle transacional, Apache Airflow para orquestração de pipelines e Apache Spark para o processamento analítico, além de Delta Sharing para o compartilhamento seguro de dados. Como resultado, apresenta-se um roadmap de implementação baseado em etapas sequenciais que envolvem desde a configuração de um cluster Kubernetes até a exposição dos dados via API. Conclui-se que a abordagem proposta possui potencial para melhorar o acesso, a eficiência e a segurança no tratamento de imagens médicas, sendo necessária sua validação prática e a investigação de desafios técnicos e regulatórios para adoção em ambientes clínicos reais. |
| Abstract: | The fragmentation of medical data across healthcare systems, combined with the increasing volume of dermatological images, poses significant challenges for integration, security, and scalability in data management. This work investigates the application of a Data Fabric architecture to optimize the storage, processing, and sharing of skin cancer images, aiming to promote interoperability and centralized governance. The proposed solution is based on a literature review and structured through a case study that analyzes the requirements, challenges, and potential benefits of adopting such an architecture in clinical settings. The architecture integrates multiple heterogeneous data sources using MinIO for layered distributed storage (bronze, silver, gold), Delta Lake for transactional control, Apache Airflow for pipeline orchestration, and Apache Spark for analytical processing, along with Delta Sharing for secure data distribution. As a result, a step-by-step implementation roadmap is presented, covering the setup of a Kubernetes cluster to data exposure via APIs. The study concludes that the proposed approach has strong potential to enhance access, efficiency, and security in the handling of medical images, while highlighting the need for practical validation and further investigation into technical and regulatory challenges for real-world clinical deployment. |
| Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, 2025. |
| Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
| Aparece na Coleção: | Engenharia de Software
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.