Roboflow数据集上传指南

Roboflow提供了一个强大的Python SDK,使得将数据集上传到工作空间变得非常简单。无论是创建新项目还是向现有项目中添加数据集,都可以通过简单的代码实现。以下是使用Python SDK上传数据集的基本步骤和代码示例。

在开始之前,确保已经安装了RoboflowPython SDK。如果还没有安装,可以通过pip安装:

pip install roboflow

此外,需要一个有效的API密钥,这可以在Roboflow账户设置中找到。

上传数据集到工作空间的新项目或现有项目,可以通过以下Python代码实现:

import roboflow as rf # 初始化Roboflow对象,传入API密钥 rf = roboflow.Roboflow(api_key="YOUR_API_KEY_HERE") # 获取工作空间 workspace = rf.workspace("WORKSPACE_URL") # 上传数据集到新项目或现有项目 workspace.upload_dataset( "./dataset/", # 数据集路径 "PROJECT_ID", # 项目ID,如果项目不存在则创建 num_workers=10, # 并发上传的图片数量 project_license="MIT", # 项目许可证类型 project_type="object-detection", # 项目类型,例如对象检测 batch_name=None, # 批次名称 num_retries=0 # 重试次数 )

在上述代码中,num_workers参数允许设置同时上传的图片数量。建议设置的值不超过25。

如果想从本地文件系统导入整个数据集,可以使用Roboflow的导入子命令。这适用于导入预先存在的数据集,或者从Roboflow Universe导入任何数据集到Roboflow项目中。

例如,如果从RoboflowUniverse下载了一个COCO格式的数据集,首先解压缩下载的数据集,然后通过指向文件夹的Roboflow导入命令,将项目导入到自己的项目中:

roboflow import ./Aerial\ Maritime.v24i.coco/

这个命令能够理解大多数常见的计算机视觉数据集格式,并为上传的图片分配训练/验证/测试分割以及注释元数据。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485