Título: | Utilizando inteligência artificial para melhorar a busca por informação em textos científicos |
Autor(es): | Messias, Henrique Martins de |
Orientador(es): | Braz, Fabricio Ataides |
Assunto: | Inteligência artificial Linguagem natural Aprendizado de máquina |
Data de apresentação: | 29-Abr-2022 |
Data de publicação: | 28-Fev-2023 |
Referência: | MESSIAS, Henrique Martins de. Utilizando inteligência artificial para melhorar a busca por informação em textos científicos. 2022. 47 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) — Universidade de Brasília, Brasília, 2022. |
Resumo: | Com o surgimento da pandemia de COVID-19, muitos artigos foram publicados sobre o novo coronavírus e seus impactos. Com um grande volume de artigos sendo publicado, aumenta a dificuldade que um pesquisador tem de encontrar a informação que está procurando, pois pode se deparar com artigos que tratam de temas semelhantes, mas não sobre o assunto desejado. O objetivo central do trabalho é usar inteligência artificial para melhorar a busca por informação em textos científicos ao extrair dados como entidades e relações. Dessa forma, a busca será feita não com a simples menção de um ou mais termos no artigo, mas será feita com base na relação entre os termos, reduzindo o tempo necessário para que o pesquisador encontre o que deseja. Para alcançar esse objetivo, tomou-se como base um trabalho já realizado no assunto para usar como referência, e, em seguida, foram realizadas tentativas para melhorar o resultado alcançado pelo trabalho ao trocar o modelo utilizado originalmente e ao usar de supervisão fraca para adquirir mais dados rotulados. Verificou-se que substituir o modelo por outro foi capaz de melhorar os resultados, enquando adquirir mais dados não foi. A partir dos resultados encontrados podemos concluir que é possível melhorar os resultados e, por consequência, aperfeiçoar a busca por informação em textos científicos. |
Abstract: | With the emergence of the COVID-19 pandemic, many articles were published about the new coronavirus and its impacts. With a large volume of articles being published, the difficulty that a researcher has to find the information he or she is looking for increases, as he or she may come across articles that deal with similar topics, but not on the desired subject. The main objective of the work is to use artificial intelligence to improve the search for information in scientific texts by extracting data such as entities and relations. In this way, the search will not be done with the simple mention of one or more terms in the article, but will be done based on the relation between the terms, reducing the time necessary for the researcher to find what he or she wants. To achieve this objective, work already done on the subject was taken as a basis to be used as a reference, and then attempts were made to improve the result achieved by the work by changing the model used originally and by using weak supervision to acquire more labeled data. It was found that replacing the model with another one was able to improve the results, while acquiring more data was not. From the results found, we can conclude that it is possible to improve the results and, consequently, improve the search for information in scientific texts |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, Engenharia de Software, 2022. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia de Software
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.