在产品开发过程中,定期回顾和改进旧的产品决策是至关重要的。今天,带来了一种新的剪切增强方法,将详细介绍这一变化的细节,以及支持推理的直觉和结果。
剪切增强是Roboflow平台提供的数据增强选项之一。在计算机视觉领域,数据增强是一种通过程序性地调整基础图像来从基础训练集中生成更多训练数据的技术。最近,通过数据增强,最先进的计算机视觉模型得到了改进。当然,增强背后的具体细节可以被讨论、探索和改进,正如将在本文的其余部分看到的那样。
之前的剪切增强方法是以一定的概率在x和y方向上从图像的两个角落进行剪切,如下所示:
旧的剪切增强方法:从两个角落剪切图像
经常注意到,使用这种方法,下游模型性能很少得到提升。
直觉是,旧的剪切增强方法过度拉伸了目标对象,并导致边界框勾勒出了很多错误的目标空间。此外,从两个方向剪切与现实世界中的透视塑造没有直接的相关性。从单一角落剪切,却有。
新的剪切增强方法现在从单一角落以概率性地剪切x,y,如下所示:
新的剪切增强方法:从单一角落剪切,模拟透视变化
角落可以随机变化,模拟现实世界中的透视变化。增强后,边界框保持更紧密。
为了验证新增强方法的改进,在剪切的公共BCCD数据集上运行了两个自动目标检测训练作业,旧的和新的。结果显示,新剪切将性能从89% mAP提高到91% mAP。然而,这两个都低于95%的原始性能,这很可能是因为血细胞数据集很少从正面显微镜照片中改变视角。这些结果证明了在基础训练集上运行多个增强实验的重要性,以找到最适合目标检测任务的增强集。