随着计算机视觉模型在各个领域的应用日益增多,引入了分类任务,以支持用户使用自己的数据集微调最先进的计算机视觉模型。让深入了解其工作原理。
图像分类是计算机视觉任务中的一项,它将给定的图像分配到一系列可能的类别中。图像分类可以是二分类的,如“狗与猫”,也可以是多分类的,如“贵宾犬、哈士奇、斗牛犬……”。在应用程序中使用图像分类时,会将图像上传到分类服务,并接收一个按模型对每个类别的置信度排序的预测类别列表。
{
"top": "paper",
"confidence": 0.5418,
"predictions": [
{
"class": "paper",
"confidence": 0.5418
},
{
"class": "rock",
"confidence": 0.4582
}
]
}
以上是一个自定义训练的“石头/剪刀”分类器的示例分类响应,可以集成到应用程序中。图像分类与目标检测不同,它不定位图像中的对象。
无论在哪里构建图像分类器,都需要收集一组示例图像,根据可能的类别对它们进行标记,并在数据集上训练图像分类模型。当对训练结果满意后,可以继续优化模型以部署和推理。幸运的是,已经在Roboflow应用程序中简化了所有这些过程。
就在几周前,宣布了对分类图像标记的新支持。也就是说,在Roboflow应用程序中,可以为图像添加类别区分,为训练做准备。
已经有一段时间支持图像增强和预处理用于分类数据集。这些技术有助于标准化数据集,并从基本数据集中生成图像转换,增加数据集版本的多样性和语义丰富性。
图像分类预处理选项:
// 预处理代码示例
图像分类增强选项:
// 增强代码示例
一旦为分类数据集选择了预处理和增强步骤,就可以在Roboflow中一键启动训练。Roboflow的训练服务器将启动并为训练一个最先进的分类模型。
在Roboflow中开始训练分类模型。
一旦模型完成训练,就可以利用它在生产应用程序中进行推理。Roboflow中的所有分类模型都经过优化并部署到一个托管的Web API上。可以将图像上传到这个API,并在低延迟(大约300毫秒)下接收分类预测。有关应用程序集成的更多详细信息,请查看分类推理文档!