在Roboflow,致力于提供最先进的技术,帮助在不需要收集更多数据或重新标记图像的情况下,提高深度学习模型的性能。专注于确保收集的数据和注释质量最高,格式正确,以便可以专注于开发的重要部分,如微调计算机视觉模型或确定模型在业务环境中的用途。
什么是边界框级别的数据增强?
数据增强是通过操作现有训练数据来增加数据集大小的行为。本质上,它是创建看起来真实的假数据。数据增强有助于模型更好地泛化到各种上下文中。(更多关于这方面的信息,请查看其他的博客文章。)
见过用户利用图像增强,仅用八(8!)个原始源图像就创建了适用于工业任务的生产就绪模型。边界框增强将这一理念更进一步:如果只改变给定边界框内的图像内容会怎样?例如,相对于背景改变物体的亮度或暗度。或者,对于经常捕捉快速移动物体的任务,相对于背景模糊物体。
边界框级别的数据增强通过仅改变源图像的边界框内容来生成新的训练数据。这样做,开发者可以更好地控制创建更适合其问题条件的训练数据。
边界框级别数据增强的起源
不能声称是第一个考虑仅边界框增强的人。2019年谷歌研究人员的一篇论文介绍了使用仅边界框增强为其模型创建最佳数据的想法。在这篇论文中,研究人员展示了仅边界框修改产生了系统性的改进,特别是对于小数据集的模型。
使用边界框级别数据增强
预见到更专业增强的许多用例。考虑仅修改OCR图像中物体的颜色,为宠物或汽车等移动物体引入模糊,旋转棋盘游戏棋子,以及翻转物体的方向以产生大多数相机情况下存在的镜像效果。
开始使用非常简单。只需切换感兴趣的任何选项,即可生成新的数据集。