目标是使计算机视觉技术更加普及。在构建视觉应用时,收集训练视觉模型所需的数据极其耗时。从今天开始,可以在Roboflow Universe中克隆超过1亿的开源图像,并将它们添加到Roboflow账户中。无论是从头开始构建数据集,采样图像以提高特定对象上模型的性能,还是生成模型以使用模型辅助标注,都可以在几分钟内快速构建或扩充数据集。
在Roboflow账户中创建了新项目后,前往Roboflow Universe并使用数据集搜索功能来寻找适合用例的项目图像。当找到一个包含适合需求的图像和/或标注的项目时,打开图像页面并选择要克隆的图像。可以通过将鼠标悬停在图像上并点击图像右上角的复选框来选择单个图像。要批量添加图像,可以点击“全选”以克隆当前结果页面中可见的所有图像。
在选择了要克隆到项目中的图像后,点击“克隆图像”并选择包含项目的Workspace。选择Workspace后,选择要将图像添加到数据集的项目。当将图像克隆到项目中时,可以选择是否导入标注。当将图像克隆到数据集中时,包含增强的图像将不会被包括在内,并且当生成数据集时,可以应用自己的增强。
导入原始图像(没有标注的图像)是一个有用的选项,当找到包含感兴趣的对象的图像,但标注可能不是集中在计划训练模型以识别的对象上时;当找到一个分类数据集,但项目需要边界框时;当想使用多边形标注,但项目有边界框时。Roboflow将检查是否尝试添加任何已经存在于项目中的图像,将无法添加重复的图像。
使用数据集搜索功能可以精确找到需要的数据来微调模型。例如,如果锈蚀检测模型在检测管道上的锈蚀方面遇到困难,将希望找到更多的管道图像来添加到数据集中。可以在项目和广泛的Roboflow Universe中使用丰富的语义搜索来找到需要的特定数据。
使用研究数据集中的数据集搜索功能可以帮助快速收集大量标注相对准确的数据,以帮助启动模型。另一种找到特定数据的方法是使用健康检查页面并点击特定类别。这将带到图像页面,并将该类别过滤到结果的顶部。