YOLO-World 是开放词汇目标检测模型,支持通过文本提示检测任意类别。
核心特点
- 开放词汇:不限于预训练类别,可通过文本提示检测新物体
- 实时检测:保持 YOLO 系列的高速特性
- 视觉语言融合:结合 CLIP 等视觉语言模型
应用场景
| 场景 | 说明 |
|---|---|
| 开放世界检测 | 检测训练时未见过的物体类别 |
| 零样本检测 | 通过文本描述直接检测 |
| 机器人感知 | 灵活识别新环境中的物体 |
参考:https://blog.csdn.net/shebao3333/article/details/143140294
YOLO-World 是开放词汇目标检测模型,支持通过文本提示检测任意类别。
| 场景 | 说明 |
|---|---|
| 开放世界检测 | 检测训练时未见过的物体类别 |
| 零样本检测 | 通过文本描述直接检测 |
| 机器人感知 | 灵活识别新环境中的物体 |
参考:https://blog.csdn.net/shebao3333/article/details/143140294
Comments