Roboflow平台中重新映射和省略类别标签

计算机视觉领域,数据集的标注工作完成后,经常需要对对象的类别标签进行更改。Roboflow平台引入了类别标签重新映射功能,使得这一过程变得更加简便。通过类别标签的重新映射和省略,可以修正计算机视觉标注中的错误,并加速计算机视觉模型的创建和探索过程,从而快速调整检测器的范围。

Roboflow中重新映射和省略类别标签的步骤

在Roboflow平台中,要重新映射或省略类别标签,首先需要导航到数据集的页面。然后,通过选择“生成新版本”并点击“添加预处理步骤”来开始。在预处理选项中选择“修改类别”,然后选择“修改类别”。接下来,将看到一个屏幕,其中包含了重新映射和省略类别的选项。

例如,可以将白色棋子的类别名称从具体的棋子类型更改为更通用的“白色”,并将黑色棋子更改为“黑色”。此外,还可以排除与“黑色皇后”相关的类别标注。完成这些更改后,点击“应用”以保存。现在,当完成其他预处理和增强设置并点击“生成”时,数据集版本将导出这些新的类别标签设置。

使用重新映射功能修正标注错误

通常,从标注工作中返回的数据可能包含一些小错误。标签可能拼写错误或超出范围。可以使用新的重新映射功能快速重命名和省略这些有问题的标注。

使用重新映射功能探索和定义模型创建

通常,开始标注的对象数量可能超过了当前建模技术能够准确处理的范围。例如,可能收集并标注了一个数据集,以区分不同品牌和型号的汽车(如丰田卡罗拉、雪佛兰沃蓝达、特斯拉Model S等)。然而,当训练检测器时,可能会发现模型在类别预测方面表现不佳。因此,可能会运行另一个实验,使用相同的数据集,将同一品牌的所有汽车型号合并为同一类别(如丰田、雪佛兰、特斯拉等)。通过这种简化,可能会发现模型性能得到了显著提升。

使用省略功能解决类别不平衡问题

在开始标注工作时,很难知道最终数据集中会出现多少对象。可能会遇到类别不平衡的问题。通过推理和实验,可能决定没有收集到足够多的一个类别,以便能够在稀疏的数据集上准确训练检测器。在这种情况下,应该从模型的语义空间中省略代表性不足的类别。

Roboflow的数据集健康检查可以帮助识别类别不平衡的问题。例如,在中,所有船只升降机都被包含在码头标签中。由于损失计算基于局部像素预测,模型可能很难同时学习预测码头和升降机。在这种情况下,选择真正关心的检测类别,并省略其他重叠的类别可能更为重要。

使用重新映射功能在合并后增加训练数据

假设正在构建一个检测器,用于计算自动驾驶汽车看到的救护车数量。在这种情况下,可能会收集一系列救护车图像并进行标注。然而,大多数时候,模型不会遇到救护车。因此,可能会考虑将包含汽车、公共汽车、卡车和摩托车的自动驾驶汽车数据集添加到数据集中。可以合并这些新图像,并将它们的类别标签重新映射为“非救护车”。

通过RoboflowPro,现在可以在Roboflow中作为数据集版本的预处理步骤重新映射和省略类别标签。类别管理是一个强大的工具,可以帮助充分利用训练数据和辛苦获得的类别标签标注。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485