Roboflow提供了一个强大的Python SDK,使得将数据集上传到工作空间变得非常简单。无论是创建新项目还是向现有项目中添加数据集,都可以通过简单的代码实现。以下是使用Python SDK上传数据集的基本步骤和代码示例。
在开始之前,确保已经安装了Roboflow的Python SDK。如果还没有安装,可以通过pip安装:
pip install roboflow
此外,需要一个有效的API密钥,这可以在Roboflow账户设置中找到。
上传数据集到工作空间的新项目或现有项目,可以通过以下Python代码实现:
import roboflow as rf
# 初始化Roboflow对象,传入API密钥
rf = roboflow.Roboflow(api_key="YOUR_API_KEY_HERE")
# 获取工作空间
workspace = rf.workspace("WORKSPACE_URL")
# 上传数据集到新项目或现有项目
workspace.upload_dataset(
"./dataset/", # 数据集路径
"PROJECT_ID", # 项目ID,如果项目不存在则创建
num_workers=10, # 并发上传的图片数量
project_license="MIT", # 项目许可证类型
project_type="object-detection", # 项目类型,例如对象检测
batch_name=None, # 批次名称
num_retries=0 # 重试次数
)
在上述代码中,num_workers
参数允许设置同时上传的图片数量。建议设置的值不超过25。
如果想从本地文件系统导入整个数据集,可以使用Roboflow的导入子命令。这适用于导入预先存在的数据集,或者从Roboflow Universe导入任何数据集到Roboflow项目中。
例如,如果从RoboflowUniverse下载了一个COCO格式的数据集,首先解压缩下载的数据集,然后通过指向文件夹的Roboflow导入命令,将项目导入到自己的项目中:
roboflow import ./Aerial\ Maritime.v24i.coco/