在数据集上传至Ultralytics HUB之后,可以立即用于模型的训练。这种集成的方法简化了从数据集管理到模型训练的过渡,极大地简化了整个过程。
在上传数据集之前,请确保数据集的YAML配置文件放置在数据集目录的根目录下,并且数据集的YAML文件和目录以及ZIP文件的名称相同。例如,如果数据集名为"coco8",那么应该有一个名为"coco8.yaml"的文件在"coco8/"目录下,当压缩该目录时,将创建一个"coco8.zip"文件。
zip -r coco8.zip coco8
可以下载提供的示例数据集COCO8并解压它,以了解数据集结构。数据集YAML遵循YOLOv5和YOLOv8的YAML格式标准。
在上传数据集至UltralyticsHUB之前,确保检查其完整性。Ultralytics HUB在上传后会对数据集进行验证,因此提前确保数据集格式正确且无错误,可以避免因数据集被拒绝而导致的任何问题。
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
一旦数据集ZIP文件准备好,就可以转到数据集页面,点击侧边栏的“数据集”按钮,然后点击页面右上角的“上传数据集”按钮。这将打开“上传数据集”对话框。
可以直接从首页上传数据集。这将打开“上传数据集”对话框。在对话框中,选择数据集任务,并在数据集ZIP文件字段中上传它。还可以为UltralyticsHUB中的数据集设置自定义的名称和描述。
当对数据集配置满意后,点击“上传”。数据集上传并处理后,可以在数据集页面访问它。可以按分割(训练、验证、测试)查看数据集中的图片。