数据标注最佳实践指南

在与Roboflow的外包标注团队合作时,向标注人员提供清晰的指导是确保数据集得到高质量整理的关键步骤。本文汇集了一系列最佳实践,帮助确保标注人员在工作过程中能够参考到一套高质量的指导说明。详细的指导有助于标注人员满足对项目的预期。

提示 #1: 提供正例

提供标注良好的图像示例是向其他标注人员解释如何标注数据的最直观方式。通过提供正确结果的示例,标注团队可以随时参考一个真实的标准。一般来说,这个真实标准的来源越大,标注过程中的混乱或沟通需求就越少。如果没有预先标注的数据示例,可以在Roboflow Annotate中标注示例图像。以下是一些标注良好的图像示例:

上面的图像中所有类别都已正确标注。图像还添加了标签,以帮助在添加到数据集后进行过滤和组织。

<img src="example1.jpg" alt="正确标注的图像示例">

上面的图像使用标注属性来增加类别(头盔)内的标注粒度(黄色)。图像还添加了标签,以帮助在添加到数据集后进行过滤和组织。

<img src="example2.jpg" alt="使用标注属性的图像示例">

此图像包含多个类别,所有类别都已正确标注。图像还添加了标签,以帮助在添加到数据集后进行过滤和组织。

<img src="example3.jpg" alt="包含多个类别的图像示例">

提示 #2: 提供反例

反例,即展示标注错误的图像,也可以帮助标注人员完成标注工作。当类别中存在主观性,容易导致误标注时,反例尤其有用。或者,如果图像中有许多可能被遗漏的对象,包括不足的示例也是很有帮助的。以下是一些标注不良的图像示例:

上面的图像缺少可见对象的标注,使其成为一个标注不足的图像。

<img src="bad_example1.jpg" alt="标注不足的图像示例">

上面的图像标注错误,因为图片中的两个人都戴着头盔,尽管只有一个人被标注为头盔。这个图像将被拒绝,不会被添加到数据集中。

<img src="bad_example2.jpg" alt="标注错误的图像示例">

无论指导是积极的还是消极的,解释它们为什么是示例和图像本身一样重要。

提示 #3: 提供未标注图像的指导

当通过正例和反例为标注数据奠定基础时,包括未标注的图像在指导中可以帮助标注人员确认他们是否正确理解了数据应该如何被解释。如果提供了正例和反例,但标注人员仍然对如何标注未标注的数据有疑问,这可能是一个强烈的信号,表明指导不够清晰。

最终,标注人员越能理解如何看待数据,标注过程就越成功。拥有未标注的示例可以作为指导质量的初始测试。

通过提供标注指导,正在教标注人员在计算机视觉方面如何站在立场上标注数据。在高层次上提供关于正在解决的问题的背景可以填补项目背后的“为什么”。

这允许标注人员不仅从被标注的内容的角度,而且从为什么被标注的角度来看待标注。这可能会在整个标注过程中激发更有信息量的问题,或确保细节不会被遗漏。添加项目背景可以像解释“正在标注建筑工地上的工人是否戴着安全帽,以帮助提高工人安全并减少工作场所伤害”一样简单。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485