张芷铭的个人博客

YOLO-World 是开放词汇目标检测模型,支持通过文本提示检测任意类别。

核心特点

  • 开放词汇:不限于预训练类别,可通过文本提示检测新物体
  • 实时检测:保持 YOLO 系列的高速特性
  • 视觉语言融合:结合 CLIP 等视觉语言模型

应用场景

场景说明
开放世界检测检测训练时未见过的物体类别
零样本检测通过文本描述直接检测
机器人感知灵活识别新环境中的物体

参考:https://blog.csdn.net/shebao3333/article/details/143140294

Comments