张芷铭的个人博客

📅 2026-02-26

#ai #deep-learning #machine-learning

YOLO-World 是开放词汇目标检测模型，支持通过文本提示检测任意类别。

核心特点

开放词汇：不限于预训练类别，可通过文本提示检测新物体
实时检测：保持 YOLO 系列的高速特性
视觉语言融合：结合 CLIP 等视觉语言模型

应用场景

场景	说明
开放世界检测	检测训练时未见过的物体类别
零样本检测	通过文本描述直接检测
机器人感知	灵活识别新环境中的物体

参考：https://blog.csdn.net/shebao3333/article/details/143140294

Comments