张芷铭的个人博客

YOLO(You Only Look Once)是单阶段目标检测算法,将检测转化为回归问题,实现实时检测。

核心思想

  • 单阶段框架:直接预测边界框和类别
  • 网格划分:图像划分为 S×S 网格,每个网格预测 B 个框
  • 端到端:一次前向传播完成检测

工作流程

  1. 预处理:缩放到固定尺寸
  2. 特征提取:骨干网络(Darknet、CSPDarknet)
  3. 特征融合:FPN、PANet
  4. 预测:检测头输出坐标、置信度、类别
  5. 后处理:NMS 去除冗余框

版本演进

版本年份核心创新
v12015单阶段回归框架
v22017Anchor Boxes,多尺度
v32018Darknet-53,FPN
v42020CSPDarknet,Mosaic
v52020PyTorch,模块化设计
v82023无锚框,解耦头
v102024NMS-Free,低延迟

最新版本

特性YOLOv10YOLOv13
创新NMS-Free超图增强
S版 mAP46.3%41.6%(Nano)
延迟2.49ms(A100)25FPS(CPU)

选型建议

场景推荐
嵌入式/移动端v5n、v8n、v7-tiny
平衡精度速度v5s/m、v8s/m
高精度v5l/x、v8l/x
多任务v8
工业部署v6、v10

Comments