Título: | Utilização de RAG na criação de chatbot para auxílio na atenção básica de saúde |
Autor(es): | Ferreira, Marcelo Junqueira Passos, Vinicius Lima |
Orientador(es): | Faleiros, Thiago de Paulo |
Assunto: | Recuperação Aumentada por Geração (Computação) Chatbots Saúde Saúde - atenção básica |
Data de apresentação: | 20-Fev-2025 |
Data de publicação: | 21-Mar-2025 |
Referência: | FERREIRA, Marcelo Junqueira; PASSOS, Vinicius Lima. Utilização de RAG na criação de chatbot para auxílio
na atenção básica de saúde. 2025. 71 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2025. |
Resumo: | Os sistemas de Recuperação Aumentada por Geração (RAG) têm se mostrado uma abordagem promissora para o desenvolvimento de chatbots que utilizam grandes modelos de
linguagem (LLMs) como base para fornecer respostas contextualizadas. Este estudo investiga a viabilidade de um chatbot RAG aplicado ao contexto da saúde, avaliando seu
desempenho técnico e explorando diferentes configurações de segmentação e indexação
dos documentos de conhecimento. Para isso, foi desenvolvido um chatbot no Telegram
que utiliza a um sistema de RAG para responder a perguntas, integrando o LLama3 e o
VectorStore ChromaDB para recuperação eficiente da informação. O sistema foi avaliado
por meio de uma pipeline automatizada utilizando o framework RAGAS, onde 18 configurações distintas do RAG foram testadas com 200 perguntas baseadas em documentos
reais da área da saúde. Os resultados indicam que o chatbot apresentou um desempenho
consistente e adequado para o suporte à saúde, sem diferenças estatisticamente significativas entre as diferentes configurações analisadas. No entanto, os desafios na avaliação
automatizada de modelos de linguagem ainda representam um fator crítico, sugerindo a
necessidade de investigações futuras que integrem avaliações humanas ao processo. |
Abstract: | Retrieval-Augmented Generation (RAG) systems have proven to be a promising approach
for developing chatbots that utilize large language models (LLMs) as a foundation to provide contextualized responses. This study investigates the feasibility of a RAG chatbot
applied to the healthcare context, assessing its technical performance and exploring different configurations for segmenting and indexing knowledge documents. To this end, a
Telegram chatbot was developed that employs a RAG system to answer questions, integrating LLama3 and the VectorStore ChromaDB for efficient information retrieval. The
system was evaluated through an automated pipeline using the RAGAS framework, where
18 distinct RAG configurations were tested with 200 questions based on real healthcare
documents. The results indicate that the chatbot demonstrated consistent and suitable
performance for healthcare support, with no statistically significant differences among the
various configurations analyzed. However, challenges in the automated evaluation of language models remain a critical factor, suggesting the need for future investigations that
incorporate human assessments into the process. |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2025. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Ciência da Computação
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.