Título: | Visualização de dados multi-dimensionais por meio de mapas de difusão |
Autor(es): | Ribeiro, Lucas Mota |
Orientador(es): | Borges, Vinícius Ruela Pereira |
Assunto: | Dados multi-dimensionais Informação Mapas de Difusão |
Data de apresentação: | 18-Jan-2019 |
Data de publicação: | 21-Jul-2020 |
Referência: | RIBEIRO, Lucas Mota. Visualização de dados multi-dimensionais por meio de mapas de difusão. 2019. xi, 55 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2019. |
Resumo: | A visualização de dados multi-dimensionais é um tópico relevante na área de Visualização da Informação, nos quais alguns dos desafios mais recorrentes ocorre devido ao crescente volume de dados a ser tratado. Além disso, a dimensionalidade desses dados têm aumentado consideravelmente. Visualizações baseadas em projeções multi-dimensionais se tornaram alternativas importantes às técnicas tradicionais, pois conseguem gerar efetivamente representações gráficas 2D ou 3D de dados definidos em um espaço de alta dimensionalidade. Uma projeção multi-dimensional tem a complexa tarefa de mapear tais dados para um espaço de baixa dimensionalidade preservando seus padrões, suas estruturas e as relações de similaridade. Devido à grande variedade de tipos de dados (imagens, texto, geográficos e etc) e as diferentes maneiras em que podem ser caracterizados, a tarefa de selecionar uma técnica para gerar visualizações representativas dos dados não é trivial. Desta maneira, esta monografia propõe estudar o emprego do algoritmo Mapas de Difusão como uma técnica de visualização baseada em projeção multi-dimensional. Na literatura, tal algoritmo originalmente proposto como uma técnica de redução de dimensionalidade, foi empregado com sucesso em tarefas de segmentação e agrupamento de dados devido à sua formulação probabilística e natureza espectral. Os experimentos foram conduzidos visando avaliar a precisão com que as relações de similaridade dos dados originais são preservadas no espaço de baixa dimensão, como também a qualidade das representações gráficas obtidas. Os resultados foram comparados com outras técnicas clássicas de projeção multi-dimensional na literatura (MultiDimensional Scaling, Isometric Feature Mapping e Locally Linear Embedding Standard) e mostraram que dado uma configuração de parâmetros correta, a técnica Mapas de Difusão é apropriada para realizar a visualização de dados multi-dimensionais. |
Abstract: | Multidimensional visualization is a relevant topic in information visualization which some of the biggest recurring callenges are caused by the increasing amount of data available. Another contributing factor is the increasing dimensionality of the data. Projection-based visualizations became a pertinent choice over the traditional projetions because they can generate 2D or 3D graphical representations of high dimensional data. A multidimensional projection performs a complex task of mapping high dimensional data into a lower dimensional space preserving its original patterns, structures and similarity relations. Given the high number of types of data (text, images, geographic, etc.) and the different strategies for its characterization, the selection of a specific technique for data visualization is considered a non-trivial task. This project proposes to study and evaluate the use of Diffusion Maps as a projection-based visualization technique. Originally proposed as a dimensionality reduction technique, the Diffusion Maps algorithm has been successfully applied in previous works to segment and clusterize data due to its probabilistic and spectral nature. Experiments were conducted aiming to evaluate the proposed visualization technique concerning the preservation of the similarity relations of the original data in the respective lower dimensional space and also the quality of the layouts. The results were compared to other classic techniques (MultiDimensional Scaling, Isometric Feature Mapping e Locally Linear Embedding Standard) which showed that Diffusion Maps is appropriate to be used as a visualization technique for multidimensional data, when setting up appropriate parameters. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.