Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/33489
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2022_JohannesPeterSchulte.pdf1,03 MBAdobe PDFver/abrir
Título: Uma abordagem para agrupar dados de NF-e com base em Autoencoder
Autor(es): Schulte, Johannes Peter
Orientador(es): Rocha Filho, Geraldo Pereira
Assunto: Redes neurais (Computação)
Notas fiscais
Mineração de dados
Data de apresentação: 28-Abr-2022
Data de publicação: 14-Fev-2023
Referência: SCHULTE, Johannes Peter. Uma abordagem para agrupar dados de NF-e com base em Autoencoder. 2022. 37 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2022.
Resumo: O método mais comum utilizado para documentar transações monetárias no Brasil é a emissão de nota fiscal eletrônica (NF-e). A auditoria de notas fiscais eletrônicas é essencial, o que pode ser aprimorado com o uso de soluções de mineração de dados, como agrupamento e detecção de anomalias. No entanto, aplicá-los não é uma tarefa simples, pois os dados da NF-e contêm milhões de registros com campos ruidosos e documentos fora do padrão. Além desses desafios, é custoso extrair informações de textos curtos para identificar vestígios de má gestão, desfalque, fraude comercial ou evasão fiscal. Soluções eficientes para agrupamento de dados com características semelhantes às NF-es até onde sabemos não foram propostas na literatura. Este trabalho desenvolveu o ELINAC, um serviço para agrupamento de dados de texto curto em NF-es que utiliza um autoencoder para agrupar dados. O ELINAC auxilia na auditoria de transações documentadas em NF-e, agrupando dados semelhantes por descrições de texto curto e facilitando a detecção de anomalias em campos numéricos. Para isso, ELINAC explora como modelar o autoencoder sem aumentar muito os custos de cálculo para suprimir um grande número de dados de texto curto. Na pior das hipóteses, os resultados mostram que o ELINAC agrupa os dados de forma eficiente enquanto executa três vezes mais rápido do que as soluções adotadas na literatura.
Informações adicionais: Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.