张芷铭的个人博客

Reranker通过Cross-Encoder深度建模查询与文档的语义匹配,对初步召回结果精排,在RAG场景中提升检索准确性20%-50%。

核心定位

阶段方法目标
召回Bi-Encoder/稀疏检索高召回率、低延迟
重排序Cross-Encoder高精度、可控成本

架构对比

架构输入方式交互粒度效率适用阶段
Bi-Encoderquery与doc分别编码无交互高(毫秒级)粗筛
Cross-Encoder[query; doc]拼接细粒度交互中(百毫秒级)精排

训练方式

方式说明
监督训练最小化交叉熵损失
对比学习最大化正负样本分数差
蒸馏学习大模型蒸馏小模型

主流模型

模型特点适用场景
ms-marco-MiniLM-L-6-v2轻量、速度快在线检索、实时RAG
ms-marco-RoBERTa-L-12-v2精度高离线重排
BGE-Reranker中文优化中文RAG

应用场景

  • RAG系统:向量检索后精排,减少上下文噪声
  • 搜索引擎:解决歧义与语义匹配问题
  • 推荐系统:提升点击率与转化率

[[query和doc]]

Comments