在机器学习领域,模型的泛化能力是指其在未见过的数据上的表现能力。为了提高模型的泛化能力,除了在训练集上进行训练外,还可以通过图像增强技术来实现。图像增强通过在训练集中创建图像的副本并对其进行各种变换,从而模拟出更多的数据变体。这种方法有助于模型学习图像的特征,而不是过度拟合特定的训练集。
Roboflow是一个强大的平台,它提供了一系列的工具来帮助用户进行图像增强,以构建用于分类模型的高质量数据集。本指南将详细介绍如何在Roboflow中创建分类项目,生成应用了多种增强的数据集版本,并展示了如何使用这些数据集进行模型训练或导出以用于自己的训练流程。
首先,需要注册一个免费的Roboflow账户。注册完成后,进入Roboflow的仪表板,并点击界面右上角的“创建项目”按钮。在新页面上,为项目设置一个名称,并选择“分类”作为项目类型,然后点击“创建项目”以完成项目的创建。
项目创建完成后,可以将项目数据上传到Roboflow。Roboflow支持多种格式的注释,包括单类和多类文件夹注释格式。如果数据已经按照支持的上传格式进行了标注,可以直接将数据拖放到Roboflow中,标签将被自动识别并保存在项目中。如果数据未标注,可以将图像拖放到Roboflow中,并在Roboflow中进行标注。
完成所有图像的标注后,可以生成一个数据集版本。数据集版本是对数据集的一个快照。可以在不改变底层数据集的情况下,对特定的数据集版本应用增强和预处理步骤。这允许为训练高性能模型进行实验,找到最佳的增强组合。
要生成数据集版本,请在Roboflow仪表板的左侧边栏点击“生成”。在该页面上,将看到多个配置选项。对于第一个数据集版本,建议保持预处理步骤为默认设置,而专注于添加增强。
向下滚动到增强面板,将看到可以应用的多种增强,包括:翻转、90度旋转、裁剪、旋转、剪切、色调、饱和度、亮度、曝光、模糊、噪声、裁剪等。当准备好应用增强时,点击“添加增强步骤”。可以选择任何可用的增强来应用。
当点击增强时,将能够预览它对数据集中的一个示例图像将产生什么影响。还可以配置增强参数。例如,如果应用亮度增强,可以自定义亮度变化的范围,以及是否添加更暗、更亮或更暗和更亮的示例。这些参数因每种增强而异。
当数据集准备就绪后,可以使用它在Roboflow上训练模型。也可以将数据导出以在自己的硬件上训练模型。要训练模型,请在数据集版本页面点击“使用Roboflow训练”按钮。将通过几个模型配置步骤,之后可以开始训练模型。使用Roboflow训练的模型可以部署在自己的硬件上,使用Roboflow Inference,这是一个开源的计算机视觉推理服务器,或者在云端。
要导出数据集,请点击“导出数据集”按钮。可以选择支持的分类导出格式之一:文件夹结构或CLIP结构。