在机器学习和计算机视觉领域,数据集的表示质量对于模型性能有着至关重要的影响。为了提升数据集的表现力,用户可以选择合适的增强技术来改善训练数据。增强技术通过现有样本生成修改后的训练数据,尤其对于小型数据集和类别不平衡的情况,图像增强可以显著提高模型的性能。
Roboflow平台提供了丰富的图像增强选项。最近,引入了三种新的增强技术,旨在进一步提升模型的性能。这三种技术都涉及到对图像色彩的修改,帮助模型更好地泛化到各种可能的输入颜色上。
在Roboflow中,用户可以选择训练集中的图像百分比,随机将其转换为灰度图像。灰度增强会随机将输入图像转换为单通道的灰度输出图像,这使得模型在颜色信号上的依赖降低——这在某些情况下可能是有益的,也可能不是。例如,如果正在构建一个总是检测单一颜色物体的模型,灰度增强可能就不太适合。
与作为预处理步骤的灰度处理不同,作为增强步骤的灰度处理是随机应用于训练数据集中的子集。在Roboflow中,用户可以选择要随机转换为灰度的图像百分比(如上所述,使用滑块表示),Roboflow会相应地生成这个数据集的版本。
用户可以选择要应用的最大色相增强量,Roboflow会随机地将这个量应用到输入的训练图像上,可以是正向或负向。色相增强会随机改变输入图像的颜色通道,使模型考虑输入图像中物体和场景的不同颜色方案。这种技术有助于确保模型不是在记忆给定物体或场景的颜色。虽然输出图像的颜色可能看起来很奇怪,甚至对人类的解释来说很怪异,但色相增强有助于模型考虑物体的边缘和形状,而不仅仅是颜色。
由于色相的起源是色彩圈,色相是以径向测量的,这意味着输入图像会根据相对于起始点的一定度数进行修改。因此,在Roboflow中,用户选择色相增强的度数,Roboflow随机确定(1)0到N之间的度数,其中N是用户选择的值,以及(2)是正向还是负向应用色相偏移(如上所述,使用度数滑块表示)。
每张图像将随机应用或移除最大选定值的饱和度。饱和度增强与色相增强类似,但它调整的是图像的鲜艳程度。完全去饱和的图像是灰度的,部分去饱和的图像颜色较为柔和,而正向的饱和度会使颜色更接近原色。
调整图像的饱和度可以帮助模型在野外颜色不同的情况下表现得更好(例如,如果设置了不同的白平衡,不同的照明效果,甚至是雾天)。