Roboflow Universe提供了丰富的数据集和预训练模型资源,以支持机器学习项目。可以通过两种主要方式将 Universe 图像添加到数据集中:下载整个数据集或从 Roboflow Universe 克隆选定的图像。
首先,在 Roboflow Universe 中找到感兴趣的数据集。然后,点击“下载数据集”按钮。这时,会弹出一个对话框,询问希望以哪种格式导出数据。显示的选项是与模型解决的计算机视觉任务(目标检测、分类、分割)兼容的格式。
可以直接从Roboflow Universe导出 ZIP 文件下载数据集,或者获取一个代码片段,以便在笔记本中使用数据集。提供的代码片段非常有用,尤其是当在笔记本中使用数据集时。
在 Roboflow 账户中创建一个新项目后,前往 Roboflow Universe 并使用“数据集搜索”功能来寻找适合用例的项目图像。
当找到一个包含适合需求的图像和/或注释的项目时,打开图像页面并选择要克隆的图像。可以通过将鼠标悬停在图像上并点击图像右上角的复选框来选择单个图像。要批量添加图像,可以点击“全选”以克隆当前结果页面中可见的所有图像。
在选择了要克隆到项目的图像后,点击“克隆图像”并选择包含项目的 Workspace。然后选择 Workspace,接着选择 Project 以将图像添加到数据集中。
当将图像克隆到项目中时,可以选择导入带有或不带有注释的图像。当将图像克隆到数据集中时,带有增强的图像将不会被包括在内,将能够在生成数据集时应用自己的增强。
导入原始图像(不带注释的图像)是一个有用的选项,当发现图像包含感兴趣的对象,但注释可能不是专注于计划训练模型以识别的对象时;当找到一个分类数据集,但项目需要边界框时;或者当想要使用多边形注释,但项目有边界框时。
Roboflow 会检查是否尝试添加已存在的图像。不用担心:无法添加重复的图像。
使用“数据集搜索”功能可以精确地找到需要的数据,以微调模型。例如,如果锈蚀检测模型在检测管道上的锈蚀方面遇到困难,将希望找到更多的管道图像来添加到数据集中。在项目和广泛的Roboflow Universe中使用丰富的语义搜索可以帮助找到所需的特定数据。
在研究数据集中使用数据集搜索可以帮助快速收集大量标记相对准确的数据,以帮助启动模型。
另一种找到特定数据的方法是使用“健康检查”页面并点击特定类别。这将带到图像页面,并将该类别过滤到结果的顶部。