Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/39633
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2024_BrunoEstevesDallaCostaFillho_tcc.pdf381,66 kBAdobe PDFver/abrir
Título: An embedding-assisted prompt-engineering approach for translating natural language text to cypher query language using a small-sized large language model
Autor(es): Costa Filho, Bruno Esteves Dalla
Orientador(es): Faleiros, Thiago de Paulo
Assunto: Linguagem natural
Banco de dados
Data de apresentação: 29-Jan-2024
Data de publicação: 22-Ago-2024
Referência: COSTA FILHO, Bruno Esteves Dalla. An embedding-assisted prompt-engineering approach for translating natural language text to cypher query language using a small-sized large language model. 2024. 11 f., il. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade de Brasília, Brasília, 2024.
Abstract: This article explores the domain of natural language translation to Cypher Query Language within the context of graph databases, focusing on the task of Text-to-CQL conversion. Leveraging a small 7-billion-parameter language model, we investigate the impact of prompt-engineering techniques on language model performance. Our experiments reveal insights into the effectiveness of different approaches, including Execution-Based Self-Consistency and Embedding-Assisted Few-Shot prompting. Additionally, we introduce a small annotated dataset constructed from official publications of a Brazilian government gazette. The results demonstrate that the Embedding-Assisted approach significantly enhances the accuracy of the small model, achieving an average result of 55.36%. When combined with Execution- Based Self-Consistency, the approach showcases consistent improvements, leading to an average result of 58.69%. Moreover, a comparative analysis with a larger 70-billion-parameter model achieved a result of 48.88%, emphasizing the efficiency gains achievable with the smaller model. The findings underscore the significance of prompt engineering in enhancing language generation capabilities for Text-to-CQL tasks, providing valuable insights for natural language interactions with graph databases. The study contributes to the evolving field of natural language translation to query languages and guides prompt-engineering techniques for efficient and accurate interactions with graph databases.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Ciência da Computação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.