Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/42615
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2025_LeonardoVitoriano_MateusDias_tcc.pdf1,59 MBAdobe PDFver/abrir
Título: Three Filters : analisador de informações científicas
Autor(es): Vitoriano, Leonardo Milomes
Dias, Mateus de Almeida
Orientador(es): Lanna, André Luiz Peron Martins
Assunto: Pesquisa científica
Metadados
Data de apresentação: 28-Jul-2025
Data de publicação: 26-Nov-2025
Referência: VITORIANO, Leonardo Milomes; DIAS, Mateus de Almeida. Three Filters: analisador de informações científicas. 2025. 66 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2025.
Resumo: O sistema Three Filters foi estruturado com o objetivo de assegurar a qualidade e integridade de metadados científicos em formato JSON, lidando com problemas relacionados à corretude estrutural, corretude informacional e completude dos dados. O método adotado compreende quatro etapas fundamentais: o Filtro de Cleaning, que retira campos desnecessário para a análise; o Filtro de Corretude Estrutural, que garante que os registros sigam a estrutura predefinida; o Filtro de Corretude Informacional, que valida o conteúdo dos campos através de expressões regulares (RegEx) configuradas; o Filtro de Completude, que calcula a completude dos registros. Esses filtros trabalham de maneira sequencial, filtrando registros inválidos e movendo-os para um Dataset Error, enquanto os registros válidos são incorporados a um novo Dataset validado. O sistema visa otimizar a qualidade dos metadados em grandes volumes de registros científicos. Os resultados esperados incluem a melhoria na qualidade dos registros processados, permitindo uma análise mais confiável e precisa. Em suma, o Three Filters pretende proporcionar uma solução eficaz para a validação de metadados científicos, contribuindo para a consistência dos dados em repositórios autodeclarados e para o ecossistema de informações científicas em geral.
Abstract: The Three Filters system was designed with the objective of ensuring the quality and integrity of scientific metadata in JSON format, addressing issues related to structural correctness, informational correctness, and data completeness. The method adopted consists of four fundamental stages: the Cleaning Filter, which removes fields unnecessary for analysis; the Structural Correctness Filter, which ensures that records follow the predefined structure; the Informational Correctness Filter, which validates the content of fields using configured regular expressions (RegEx); and the Completeness Filter, which calculates the completeness of the records. These filters work sequentially, filtering out invalid records and moving them to a Dataset Error, while valid records are incorporated into a new validated Dataset. The system aims to optimize the quality of metadata in large volumes of scientific records. The expected results include an improvement in the quality of processed records, enabling more reliable and accurate analysis. In summary, the Three Filters seeks to provide an effective solution for validating scientific metadata, con tributing to data consistency in self-declared repositories and to the scientific information ecosystem as a whole.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, 2025.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Engenharia de Software



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.