RAG 学习与探索

RAG (Retrieval Augmented Generation)检索增强生成

随着LLM的逐渐火热，RAG也开始出现在了人们的视野中，通俗来讲，RAG就是在LLM的基础上，结合额外提供的知识库内容，生成更加准确的回答。

显而易见，RAG解决了通用LLM的以下几个缺点：

rag-1

传统的RAG流程十分简单：将文本分块，通过嵌入模型将其转化为向量存储在向量数据库中，查询时，通过一些距离算法（余弦相似性、欧氏距离等），获取top_k个片段，LLM根据获取的片段进行针对性的回答。

当然传统的RAG也是存在一些缺点的：

rag-3

以Cherry Studio中实现的Rerank Rag为例，在传统RAG的链路中加入了Rerank模型。

Rerank的核心是基于BERT的cross-encoder模型，具体原理如下：

使用Rerank Rag获得的优点：

高精确性：Rerank模型通过交叉编码器对query和文字块进行语义匹配度计算，提高检索结果的精确性。
高性价比：使用Rerank会有一种四两拨千斤的感觉，不仅提供了一种简单且低复杂度的方法来改善搜索结果，允许用户将语义相关性纳入现有的搜索系统中，而且无需进行重大的基础设施修改。

这是对现有的Cherry Studio知识库增强的一次尝试，后续还有更多的增强知识库的工作要做。

To Be Continue…