Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/27582
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2020_FredericoDePaivaLenza_tcc.pdf2,67 MBAdobe PDFver/abrir
Título: Mineração visual de dados em notas fiscais do consumidor eletrônicas
Autor(es): Lenza, Frederico de Paiva
Orientador(es): Borges, Vinícius Ruela Pereira
Assunto: Notas fiscais
Mineração de dados
Processamento eletrônico de dados
Data de apresentação: 11-Dez-2020
Data de publicação: 18-Mai-2021
Referência: LENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020
Resumo: Uma grande quantidade de notas fiscais de consumidor eletrônicas, associadas às com- pras em estabelecimentos comerciais, atacado e varejo, são geradas diariamente no Brasil. Nos dados das notas fiscais, existem alguns tipos de fraude relacionados com a evasão tributária, que é definida como a total ou parcial intenção de se isentar de pagar um tributo. Esta monografia propõe um processo de visualização exploratória, com o obje- tivo de auxiliar os especialistas em tarefas de auditoria fiscal, visando detectar fraudes e anomalias em dados financeiros. O processo foi formulado de forma que o especialista análise dados financeiros e que possuem atributos de diferentes tipos por meio de visu- alizações baseadas no posicionamento de pontos, considerando três diferentes técnicas de projeção multidimensional: Multidimensional Scaling, Isometric Mapping e t-distributed Stochastic Neighbor Embedding. As fraudes e anomalias nos dados financeiros podem ser identificadas pelo especialista ao interpretar os padrões e as relações de similaridade nas representações gráficas obtidas, como também pode-se manipular os pontos por meio de técnicas de interação, com possibilidade de utilizar algoritmos de agrupamento com a finalidade de enriquecer a análise. Nos experimentos, foram utilizados conjuntos de dados provenientes de notas fiscais do consumidor eletrônicas do Distrito Federal e de compras de cartão de crédito. As representações gráficas produzidas pela técnica de visualização t-SNE apresentaram melhor qualidade em relação às demais, sendo possível identificar as notas fiscais mais similares e que possuem tributação parecida, como também notas fiscais que possuem anomalias e que podem ser indícios de fraude. O processo de visualização exploratória mostrou ser potencialmente útil para auxiliar o especialista no entendimento dos padrões globais e locais nos dados por meio da interação com as representação gráficas obtidas.
Abstract: A great quantity of electronic receipts, associated with purchases in commercial estab- lishments, wholesale and retail, are generated daily in Brazil. There are some types of fraudulent behaviors related to electronic receipts, these behaviors are defined as the total or partial intention of exempting yourself from paying a tribute. This study proposes a visual exploration process aiming at supporting specialists in the task detecting frauds and anomalies in transactional data. The process was created in a way that enables the specialist to visualize transactional data that present attributes of different types us- ing multidimensional projection algorithms, such as Multidimensional Scaling, Isometric Mapping and t-distributed Stochastic Neighbor Embedding. Anomalies in transactional data can be identified by the specialist when interpreting patterns and similarity relation- ships embedded in the obtained graphical layouts. The layouts can also be manipulated to a certain degree with the usage of techniques such as zoom and filter. Optionally, the layout can also be clustered to reveal hidden patterns found by unsupervised machine learning algorithms. The datasets used in the experiments were from the electronic tax invoice data gathered in the Federal District and a German credit card dataset. The graphical representations generated through t-SNE had the best quality from the other techniques utilized, being possible to identify data clustered together with similar data as well as potential evidence of anomalies. The visual exploration process showed to be useful to support the specialist in understading the global and local data patterns by means of interactive resources with the obtained layouts.
Informações adicionais: Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.