Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/33489
Título: | Uma abordagem para agrupar dados de NF-e com base em Autoencoder |
Autor(es): | Schulte, Johannes Peter |
Orientador(es): | Rocha Filho, Geraldo Pereira |
Assunto: | Redes neurais (Computação) Notas fiscais Mineração de dados |
Data de apresentação: | 28-Abr-2022 |
Data de publicação: | 14-Fev-2023 |
Referência: | SCHULTE, Johannes Peter. Uma abordagem para agrupar dados de NF-e com base em Autoencoder. 2022. 37 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2022. |
Resumo: | O método mais comum utilizado para documentar transações monetárias no Brasil é a emissão de nota fiscal eletrônica (NF-e). A auditoria de notas fiscais eletrônicas é essencial, o que pode ser aprimorado com o uso de soluções de mineração de dados, como agrupamento e detecção de anomalias. No entanto, aplicá-los não é uma tarefa simples, pois os dados da NF-e contêm milhões de registros com campos ruidosos e documentos
fora do padrão. Além desses desafios, é custoso extrair informações de textos curtos para identificar vestígios de má gestão, desfalque, fraude comercial ou evasão fiscal. Soluções eficientes para agrupamento de dados com características semelhantes às NF-es até onde sabemos não foram propostas na literatura. Este trabalho desenvolveu o ELINAC, um serviço para agrupamento de dados de texto curto em NF-es que utiliza um autoencoder para agrupar dados. O ELINAC auxilia na auditoria de transações documentadas em
NF-e, agrupando dados semelhantes por descrições de texto curto e facilitando a detecção de anomalias em campos numéricos. Para isso, ELINAC explora como modelar o autoencoder sem aumentar muito os custos de cálculo para suprimir um grande número de dados de texto curto. Na pior das hipóteses, os resultados mostram que o ELINAC agrupa os dados de forma eficiente enquanto executa três vezes mais rápido do que as soluções adotadas na literatura. |
Informações adicionais: | Trabalho de conclusão de curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.