大多数对象检测模型被训练来识别一个狭窄的、预定的类别集合。这种方法的主要问题是缺乏灵活性。每当想要扩展或更改可识别对象的集合时,必须收集数据、标记它,并重新训练模型。这当然既耗时又昂贵。零样本检测器希望通过在不重新训练模型的情况下检测新对象来打破这种现状。所需要做的就是改变提示,模型就会检测描述的对象。
在下面的例子中,使用Grounding DINO——最新的SOTA零样本对象检测模型,来可视化预测结果。在左侧的图像中,提示模型识别“椅子”类别——一个属于COCO数据集的类别。模型在没有任何问题的情况下成功检测到了所有这个类别的对象。在右侧的图像中,试图找到模型知识的边界,并询问狗的尾巴。这个对象当然不在任何常用的数据集中,但它还是被找到了。