Título: | Ferramenta orientada a algoritmos de deep learning para identificação e categorização de blocos de informação em faturas de energia |
Autor(es): | Schadt, Renan Welz |
Orientador(es): | Serrano, Maurício |
Coorientador(es): | Serrano, Milene |
Assunto: | Redes neurais (Computação) Aprendizado de máquina |
Data de apresentação: | 18-Dez-2023 |
Data de publicação: | 31-Jul-2024 |
Referência: | SCHADT, Renan Welz. Ferramenta orientada a algoritmos de deep learning para identificação e categorização de blocos de informação em faturas de energia. 2023. 112 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2023. |
Resumo: | Faturas são documentos que relatam uma transação comercial. Seu processamento em
massa é uma realidade em diversas empresas, porém, a maior parte desse processamento
ainda é feito de forma manual. Abordagens automáticas são raras, seja pela imprevisibilidade dos layouts nas faturas, ou pelo seu conteúdo com informações sensíveis. Dentro
do mercado de energia brasileiro existem mais de 100 distribuidoras emitindo um conjunto incontável de layouts distintos de fatura. O presente trabalho tem como objetivo
criar uma ferramenta para fazer a identificação e categorização de blocos de informação
relevantes em faturas de energia. Para isso, o sistema utiliza uma rede neural para detecção de objetos (RetinaNet) em conjunto com uma ResNet-50 para extração dos mapas
de características. O processo de treinamento ocorre em um conjunto de mais de 10 mil
faturas de duas distribuidoras de energia, em um número limitado de blocos (tabela de
faturamento, impostos, leitura, informações do cliente e número da instalação). Ao final
da pesquisa foi possível analisar a eficiência da implementação, através de métricas como
mAP e se a solução também é válida para outras distribuidoras de energia. |
Abstract: | Invoices are documents that report a business transaction. Its mass processing is a reality
in several companies, however, most of this processing is still done manually. Automatic
approaches are rare, either because of the unpredictability of layouts on invoices, or because of their content with sensitive information. Within the Brazilian energy market there
are more than 100 distributors issuing an uncountable set of different invoice layouts. This
work aims to create a tool to identify and categorize relevant blocks of information on
energy bills. For this, the system use a neural network for object detection (RetinaNet)
together with a ResNet-50 for feature map extraction. The training process take place in
a set of more than 10 thousand invoices from two energy distributors, in a limited number
of blocks (billing table, taxes, reading, customer information and installation number). At
the end of the research, it was possible to analyze the efficiency of the implementation,
through metrics such as mAP and whether the solution is also valid for other energy
distributors. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, 2023. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia de Software
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.