在机器学习和计算机视觉领域,预训练模型因其在大量数据集上学习到的特征而受到青睐。这些模型能够快速部署并提高物流操作的效率。例如,Roboflow物流模型在20个类别的99,238张图像上进行了训练,提供了特定领域的优化。在与COCO基准测试中,该模型在与建筑、物流和制造业相关的4个随机选择的数据集中,验证集上的mAP50得分高达3.8%以上。
预训练模型是经过大量多样化数据集训练的机器学习模型,它们学习了一系列广泛的“特征”。特征是从用于训练模型的数据中推断出的知识。预训练模型的本质在于其能够将这些学到的特征泛化到新的、但相关的任务上,从而显著减少训练新模型所需的时间和计算资源。
这些模型是许多机器学习项目的起点。对于希望解决特定领域问题而不从零开始的人来说,预训练模型尤其有益。这有助于加快包裹跟踪、盗窃检测或操作优化等应用程序的开发。
Roboflow物流预训练模型详解
Roboflow物流模型在Roboflow Universe上的多个项目中收集的99,238张图像上进行了训练,涵盖了物流相关的20个类别。数据集中的部分数据使用Autodistill-DETIC自动标记,这是一个开源工具,能够使用DETIC自动标记数据。使用Autodistill-DETIC大大加快了标记过程。
该模型使用Ultralytics YOLOv8架构进行训练,达到了76%的平均精度均值(mAP),显示出在检测和分类物流操作相关对象方面的强劲性能。
数据集来自Roboflow Universe,这是一个社区,托管了超过250,000个计算机视觉数据集,用于训练模型。最终模型包括99,238张图像,分为训练、测试和验证集。超过60%的数据集使用Autodistill-DETIC自动标记。
模型评估
为了比较物流预训练目标检测模型与使用COCO预训练权重初始化的基线模型的性能,使用了五个不同的数据集进行比较,这些数据集被选为多样化,包括五个类别在COCO和物流中都常见的数据集,以及五个类别在两者中都未见过的数据集。
在五个案例中的四个中,使用Roboflow物流预训练权重的结果在验证集上的mAP分数更高,与使用COCO基线检查点相比,验证集上的mAP50差异在0.4%到3.8%之间。
这些变化突出了在与该领域密切相关的任务上使用特定领域的预训练模型的价值,例如物流。
使用案例
使用案例1:直接推理。要实现最小的设置即可立即进行目标检测,可以使用直接推理方法。下面的脚本下载所需的Roboflow库,初始化预训练模型,并在选择的图像上进行推理。输出将是一个包含预测结果的JSON对象。
!pip install roboflow
from roboflow import Roboflow
rf = Roboflow(api_key="api_key")
project = rf.workspace("large-benchmark-datasets").project("logistics-sz9jr")
model = project.version(1).model
print(model.predict("your_image.jpg", confidence=40, overlap=30).json())
# 下载预训练权重
# ...
from ultralytics import YOLO
model = YOLO('./best.pt')
project = rf.workspace("workspace_name").project("project_name")
dataset = project.version(1).download("yolov8")
model.train(data=dataset.location + '/data.yaml', epochs=50, imgsz=640)