RAG(Retrieval-Augmented Generation)通过检索外部知识库增强生成模型,解决纯生成模型依赖训练数据的局限。
核心架构
| 模块 | 说明 |
|---|---|
| 检索模块 | 从知识库检索相关文档(向量检索/BM25) |
| 生成模块 | 基于检索结果生成答案(LLM) |
工作流程
- 输入处理:接收用户查询
- 检索文档:从知识库返回Top-K相关片段
- 生成答案:LLM结合查询和检索内容生成回答
优势
| 优势 | 说明 |
|---|---|
| 结合外部知识 | 获取实时、广泛的知识 |
| 提升生成质量 | 减少幻觉,提高事实准确性 |
| 灵活性强 | 检索与生成模块解耦,可独立优化 |
应用场景
| 场景 | 说明 |
|---|---|
| 事实性问答 | 从知识库检索精确答案 |
| 对话系统 | 增强知识密集型对话 |
| 开放领域问答 | 处理多主题问题 |
挑战
| 挑战 | 说明 |
|---|---|
| 检索质量 | 生成效果依赖检索结果 |
| 效率问题 | 大规模检索可能成为瓶颈 |
[[Reranker(重排序)模型]]
张芷铭的个人博客
Comments