在计算机视觉领域,多边形标注是一种重要的技术,它对于准备用于训练实例分割或语义分割模型的数据集至关重要。与边界框相比,多边形标注可以提供更精确的对象定位,从而在某些情况下提高模型的准确性。然而,如果没有合适的工具,多边形标注可能会比边界框更耗时,因为它需要多次交互来标记一个对象。对于Roboflow用户来说,现在情况不再是这样了。多边形标注现在可以像边界框一样快速应用于对象。
如果对使用Roboflow Train训练实例分割模型或者使用开源模型如YOLOv5实例分割或Mask RCNN感兴趣,那么需要使用多边形标注。一旦用多边形进行了标记,模型检测可以用来通过像素转换到标准测量来测量对象的大小。
让看看如何快速地应用多边形标注来标记图像。要使用智能多边形功能,点击标注工具栏中的智能多边形。然后点击想要标记的对象的中心,智能多边形将为对象应用一个初始标签。这将使用后台的机器学习模型来为对象建议一个形状。
通常,标签只需单击一次就能准确预测,然后可以通过按Enter键,然后选择对象的类别来移动到下一个对象。在智能多边形标签没有完美捕捉到感兴趣的对象的情况下,可以通过点击应用标签的外部来扩展选择,或者点击形状内部来移除区域。可以通过添加更多的正点和负点来细化标注,直到对模型的结果感到满意。
另一种引导智能多边形工具的方法是点击并拖动,围绕对象创建一个框,以更清晰地指示对象在图像中的位置。这在有遮挡对象的情况下特别有用。此外,可以通过右键点击标签将边界框或多边形标注转换为智能多边形。
将边界框转换为智能多边形在自动化标签时特别有用,例如使用Label-Assist自动化标签。这消除了初始标记步骤,让专注于通过将它们转换为智能多边形来细化标签。如果遇到一个难以应用自动化标签的对象,也可以通过移动它们或添加额外的点来编辑标签的顶点。
使用标注工具左上角的智能多边形选项,可以通过在凸包、平滑和复杂标签之间切换来选择标签中的顶点数量(如果放置了错误点,还可以撤销)。建议使用最少的顶点数量来准确标记对象。这在未来手工细化多边形时会更容易,并且可以使数据集更小,数据处理和转换更快。
智能多边形对于标记语义分割数据也很有帮助。只是要确保正确地排序对象的z-index,以便根据想要训练模型的方式正确堆叠掩码。可以使用侧边栏中的Layers标签来可视化堆叠。这将帮助了解一旦光栅化,分割掩码会是什么样子。
所有用户,包括免费公共层级用户,都可以使用智能多边形,所以登录并尝试一下,看看多边形是否可以提高模型准确性或加快标记过程。如果需要数据来构建项目,可以在Roboflow Universe中找到实例分割和语义分割数据集来启动项目。