Utilize este link para identificar ou citar este item:
https://bdm.unb.br/handle/10483/22719
Título: | Princípios de classificação automática de documentos eletrônicos |
Autor(es): | Rocha Junior, Joaquim Morais |
Orientador(es): | Caribé, Rita de Cássia do Vale |
Assunto: | Classificação bibliográfica Documentos eletrônicos |
Data de apresentação: | 24-Ago-2017 |
Data de publicação: | 19-Nov-2019 |
Referência: | ROCHA JUNIOR, Joaquim Morais. Princípios de classificação automática de documentos eletrônicos. 2017. 64 f., il. Trabalho de Conclusão de Curso (Bacharelado em Biblioteconomia)—Universidade de Brasília, Brasília, 2017. |
Resumo: | Revisão de literatura sobre o tema de classificação automática de documentos eletrônicos. A
proposta deste trabalho é apresentar e descrever os procedimentos utilizados para a realização
de classificação automática de documentos eletrônicos textuais. Na revisão de literatura se
contextualiza classificação, classes, taxonomia, categorias, sistemas de classificação e os
procedimentos utilizados para a classificação automática de documentos. Dentre os
procedimentos descritos se destacam o pré-processamento com a “limpeza” dos textos
removendo termos/caracteres não necessários; a fase de indexação os documentos são
transformados em listas de termos representativos; na fase de seleção de atributos dos
documentos os termos mais representativos são selecionados; na fase de
classificação/categorização os documentos são alocados/agregados nas classes que mais os
representam. Apresenta sugestões para pesquisas utilizando os sistemas de classificação
bibliográficos, ontologias, tesauros e taxonomias na classificação/categorização/agrupamento
automática. |
Abstract: | Review of literature on automatic classification of electronic documents. The purpose of this
paper is to present and describe the procedures used to perform automatic classification of
textual electronic documents. In the literature review we contextualize classification, classes,
taxonomy, categories, classification systems and the procedures used for automatic
documents classification. Among the procedures described, the preprocessing with the
"cleaning" of the texts, removing unnecessary terms / characters; The indexing phase
documents are transformed into lists of representative terms; In the feature selection phase the
most representative terms are selected; In the classification / categorization phase the
documents are allocated / aggregated in the classes that best represent them. It presents
suggestions for research using the bibliographic classification systems, ontologies, thesauri
and taxonomies in the classification / categorization / automatic grouping. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade de Ciência da Informação, 2017. |
Aparece na Coleção: | Biblioteconomia
|
Este item está licenciado na Licença Creative Commons