Roboflow数据上传与处理指南

机器学习和人工智能项目中,数据是至关重要的。Roboflow提供了一个平台,让能够轻松地上传、管理和使用数据集。本文将详细介绍如何通过不同的方式将数据添加到Roboflow账户中,以及如何处理这些数据。

如何添加数据

可以通过以下方式将数据添加到Roboflow账户:

  • 使用Web界面(适合初学者,且图片数量不超过1000张)
  • 使用命令行
  • 使用开源用户生成的数据集

首先,如果还没有项目,需要创建一个。创建项目时,系统会提示上传图片。如果已经拥有项目,可以点击项目侧边栏中的“上传”按钮来上传图片。

对于较大的数据集,可以使用roboflow-python命令行界面(CLI)进行上传。首先,通过运行pip install roboflow安装roboflow-python CLI,然后使用roboflow import命令上传数据集。有关详细操作指南,请参阅RoboflowCLI上传部分的说明,或观看相关视频教程。

Roboflow能够接受以下类型的数据:

  • JPG、PNG、WEBP和BMP格式的图片
  • MOV和mp4格式的视频
  • 适用于分类、目标检测、分割和关键点检测的任何支持格式的数据

Roboflow Universe是一个包含超过200,000个数据集的仓库,涵盖目标检测、分类和分割任务。可以使用Universe来寻找用于训练模型的初始版本数据,或用于微调模型的数据。

如果合并两个数据集,合并后的数据集以及两个原始数据集都会存在于账户中。因此,合并操作不会产生额外费用,因为图片是重复的。

非常重视用户的数据所有权。根据服务条款(特别是第23B节),保留上传到Roboflow的所有图片和视频的所有权。在Roboflow上发布、提交、发布、展示或传输的任何内容、信息或材料,都保留所有所有权。

为了防止在训练过程中出现问题,会在上传/导入和导出时清理类别名称。在上传时,会执行以下操作:

  • 去除前后空格
  • 所有空格(包括换行符和制表符)转换为单个空格
  • 去除多余的空格
  • 将/.[]#~*字符替换为短横线(-)
  • 去除|'"字符

类别名称清理也会在导出时进行。

公共计划:如果使用的是公共计划,除非由Roboflow明确指定和安排,否则数据集将在Roboflow Universe上公开。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485