在监控自家后院的野生动物活动,或识别人们在早高峰期间使用的交通工具时,可以训练模型来完成这些任务。无论用例是什么,户外监控数据的标注可能相当棘手,尤其是当目标物体远离摄像头时。在标注户外监控数据时,有几个因素需要考虑,从使用紧密的边界框标注到妥善管理本体论。在本指南中,将讨论如何标注户外监控数据,以创建一个高质量的数据集,用于训练计算机视觉模型。让开始吧!
计算机视觉模型的构建是为了识别与训练它们识别的物体相对应的像素模式。在户外监控数据中,至关重要的是紧密地标注感兴趣的物体,以便教会计算机视觉模型识别正在处理的精确像素,尤其是在物体远离时。
最佳实践是即使物体被遮挡,也将其标注为完全可见。当物体被另一个物体部分遮挡或不在视野中时,就被认为是被遮挡的。在这个例子中,即使有其他野猪挡住了视线,也想完全标注每只野猪。
如果希望捕获物体的多个属性,类别的命名约定将在使数据可用性方面发挥关键作用。例如,假设将滑板上的人标注为person_skateboard
,将骑滑板车的人标注为person_scooter
。这些类别将使能够训练模型来识别滑板和滑板车上的人。然而,如果只想训练一个模型来识别正在移动的人,而不考虑交通方式,可以通过预处理步骤将类别名称合并为person_moving
。
为了使计算机视觉模型在生产中表现良好,它必须在与训练数据相似的视觉输入上使用。例如,如果计划部署一个模型来捕获离地面三英尺的摄像头数据,但模型是在离地面三十英尺的摄像头数据上训练的,那么模型的表现将不如它可能的表现。
通过Roboflow的Outsource Labeling
服务,可以直接与专业标注者合作,为各种规模的项目进行标注。Roboflow管理着一群训练有素的专家,他们使用Roboflow平台来更快、更便宜地策划数据集。
开始使用外包标注的第一步是填写intake form
,提供项目的详细信息和要求。从那里,将与一个标注团队联系,直接在标注项目上合作。
在与专业标注者合作时,清晰地记录指示是过程的一个重要部分。经常看到,最成功的标注项目是那些在一开始就提供了良好记录的指示,与标注者就一批初始图像进行了初步反馈,然后显著增加了标注量的项目。阅读guide to writing labeling instructions
,了解更多关于如何编写有信息量的指示。