张芷铭的个人博客

RAG(Retrieval-Augmented Generation)通过检索外部知识库增强生成模型,解决纯生成模型依赖训练数据的局限。

核心架构

模块说明
检索模块从知识库检索相关文档(向量检索/BM25)
生成模块基于检索结果生成答案(LLM)

工作流程

  1. 输入处理:接收用户查询
  2. 检索文档:从知识库返回Top-K相关片段
  3. 生成答案:LLM结合查询和检索内容生成回答

优势

优势说明
结合外部知识获取实时、广泛的知识
提升生成质量减少幻觉,提高事实准确性
灵活性强检索与生成模块解耦,可独立优化

应用场景

场景说明
事实性问答从知识库检索精确答案
对话系统增强知识密集型对话
开放领域问答处理多主题问题

挑战

挑战说明
检索质量生成效果依赖检索结果
效率问题大规模检索可能成为瓶颈

[[Reranker(重排序)模型]]

Comments