张芷铭的个人博客

DETR 将目标检测建模为集合预测问题,通过二分图匹配和 Transformer 实现端到端检测。

论文:End-to-End Object Detection with Transformers

核心思想

  • 集合预测:直接输出固定数量的预测框,无需 NMS
  • 二分图匹配:强制唯一预测,消除重复检测
  • Transformer 架构:编码器-解码器处理全局上下文

Comments