YOLO(You Only Look Once)是单阶段目标检测算法,将检测转化为回归问题,实现实时检测。
核心思想
- 单阶段框架:直接预测边界框和类别
- 网格划分:图像划分为 S×S 网格,每个网格预测 B 个框
- 端到端:一次前向传播完成检测
工作流程
- 预处理:缩放到固定尺寸
- 特征提取:骨干网络(Darknet、CSPDarknet)
- 特征融合:FPN、PANet
- 预测:检测头输出坐标、置信度、类别
- 后处理:NMS 去除冗余框
版本演进
| 版本 | 年份 | 核心创新 |
|---|
| v1 | 2015 | 单阶段回归框架 |
| v2 | 2017 | Anchor Boxes,多尺度 |
| v3 | 2018 | Darknet-53,FPN |
| v4 | 2020 | CSPDarknet,Mosaic |
| v5 | 2020 | PyTorch,模块化设计 |
| v8 | 2023 | 无锚框,解耦头 |
| v10 | 2024 | NMS-Free,低延迟 |
最新版本
| 特性 | YOLOv10 | YOLOv13 |
|---|
| 创新 | NMS-Free | 超图增强 |
| S版 mAP | 46.3% | 41.6%(Nano) |
| 延迟 | 2.49ms(A100) | 25FPS(CPU) |
选型建议
| 场景 | 推荐 |
|---|
| 嵌入式/移动端 | v5n、v8n、v7-tiny |
| 平衡精度速度 | v5s/m、v8s/m |
| 高精度 | v5l/x、v8l/x |
| 多任务 | v8 |
| 工业部署 | v6、v10 |
Comments