Eson Wong's Blog

Eson Wong's Blog

马上订阅 Eson Wong's Blog RSS 更新: https://blog.esonwong.com/atom.xml

什么是检索增强生成(Retrieval-Augmented Generation)?

2024年9月10日 09:50

最近在主导一个 AI 检索的项目,需要对检索增强生成(RAG)有所了解,下面是我对检索增强生成(RAG)的一个初浅的了解。

索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。

检索增强生成(RAG)的原理图如下:

graph TB  subgraph 用户交互    Start([用户查询]):::user    End([交互响应]):::user  end  subgraph 大语言模型  end  subgraph 知识库构建    SD[(结构化知识库)] --> 向量化知识库 --> VD[(向量知识库)]  end  Start ==> 向量化用户查询 ==> 向量检索 ==> 相关知识  Start ==> 提示词模版  相关知识 ==> 提示词模版  提示词模版 == 组合 ==> 模型输入  模型输入 ==> 大语言模型 ==> 模型输出 ==> End  相关知识 ==> End  向量化知识库 o-.-o 大语言模型  向量化用户查询 o-.-o 大语言模型  向量检索 o-.-o VD  相关知识 o-.匹配.-o SD  classDef user fill:green,color:white