Título: | Mineração de Dados : uma aplicação na base de dados de artigos de periódicos científicos das áreas de informação (ABCDM) |
Autor(es): | Souza, Held Barbosa de Naglis, Daniela Leite |
Orientador(es): | Pereira Júnior, Romualdo Alves Vilan Filho, Jayme Leiro |
Assunto: | Mineração de dados Mineração de texto Áreas de informação Brasil |
Data de apresentação: | 4-Nov-2008 |
Data de publicação: | 17-Fev-2009 |
Referência: | SOUZA, Held Barbosa de; NAGLIS, Daniela Leite. Mineração de Dados: uma aplicação na base de dados de artigos de periódicos científicos das áreas de informação (ABCDM). 2008. 155 f. Monografia (Especialização em Gestão de Tecnologia da Informação)-Universidade de Brasília, Brasília, 2008. |
Resumo: | Apresenta um estudo do processo de Mineração de Dados na ferramenta Rapid Miner com a base de dados ABCDM, que contém os artigos de periódicos científicos das áreas de informação publicados no Brasil. Com o foco na Mineração de Texto, o processo analisa os títulos dos artigos da base de dados e identifica os assuntos mais relevantes das décadas de 70, 80, 90 e dos anos 2000, até 2007, com base no índice TF/IDF. Os principais assuntos dos títulos dos artigos publicados nos anos 2000 são identificados com maior especificidade através do algoritmo K-Means. Conclui que os resultados confirmaram alguns comportamentos já percebidos pelos pesquisadores das áreas de informação, que o processo de Mineração de Dados também é eficiente na análise de dados bibliográficos e que estudos mais aprofundados poderão ser realizados posteriormente. |
Abstract: | Mining using the tool Rapid Miner over the database ABCDM, that contains the scientific periodic articles of the information science field published in Brazil. Focusing the Text Mining, the process analyzes the headings of articles in the database and identifies the most relevant subjects of the 70s, 80s, 90s and between 2000 and 2007, on the basis of the index TF/IDF. The main subjects of the articles headings published between 2000 and 2007 are identified with the greater specificity through the operator K-Means. The results had confirmed some behaviors already perceived by the researchers of the information areas. The process of Data Mining also is efficient in the analysis of bibliographical data and that deepened studies should be carried out later. |
Informações adicionais: | Monografia (especialização)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2008. |
DOI: | http://dx.doi.org/10.26512/2008.11.TCC.158 |
Aparece na Coleção: | Gestão de Tecnologia da Informação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.