在机器学习项目中,确保每次模型迭代所使用的图像、预处理和增强步骤的一致性至关重要。这不仅有助于复现结果,还能科学地在不同模型和框架间进行测试,从而确信结果的差异源于模型变化,而非数据流程中的bug或变更。一旦创建了数据集版本,它就会被冻结,这意味着后续对项目所做的任何更改,如添加或删除图像、注释或其他数据,都不会影响之前创建的版本。
要创建数据集版本,首先点击与Roboflow项目关联的侧边栏中的“版本”选项。然后,点击“生成新版本”。在该页面,可以设置训练/测试/验证数据集的分割比例,并指定新数据集版本的预处理步骤和增强操作。
在指定了想要应用于数据的预处理步骤和增强操作后,点击“生成”按钮。这将生成一个新的数据集版本。然后,可以使用此数据集版本在Roboflow中训练模型。也可以将数据集导出,用于手动训练模型。
调整训练/验证/测试数据集分割比例
在版本创建过程中,还可以重新调整训练、验证和测试数据集分割的比例。为此,请转到“步骤2:训练/测试分割”并点击“重新平衡”按钮。