持续改进模型与数据收集

在产品首次部署到现实世界时,会发现一些边缘案例会让现有的模型感到困惑。因此,从现场收集数据并持续迭代模型至关重要。部署第一个模型只是起点,而非终点。随着模型的改进,产品将获得更广泛的使用,这将帮助收集更多数据,进一步改进模型,形成一个良性循环。

数据积累的过程是构建持久竞争优势的关键。可以在中了解更多关于主动学习的过程。

Roboflow的上传API

为了帮助实现模型的持续改进,Roboflow今天推出了上传API,并向所有用户开放。通过将上传API集成到应用程序中,可以直接从部署的应用程序中向数据集添加图像。

开始使用非常简单,只需前往账户页面中的并创建API密钥。可以在仪表板中创建API密钥。请像对待密码一样对待此密钥,因为它可以用于访问和修改Roboflow账户上的数据。(随着时间的推移,将添加更多的API功能。)

然后在Roboflow中创建一个数据集来存放上传的图像。将上传的图像与生产数据分开,可以让轻松跟踪哪些图像需要标记和审核。它还可以让在不污染主数据集的情况下过滤掉垃圾图像。可以通过URL获取数据集标识符;这是告诉上传API希望将图像添加到哪个数据集的方式。

数据集ID最方便的获取方式是通过Web界面中数据集的URL。在中找到选择的编程语言的代码片段,并将其添加到应用程序中。建议为用户提供一种标记模型表现不佳的方式,以便可以收集最能改进模型的特定边缘案例的示例。但是,上传现实世界图像的随机样本总比什么都不做要好,可以作为一个很好的第一步。

为许多语言提供了代码片段;如果首选环境尚未出现,请告诉,将很高兴添加它!然后,每隔一段时间,使用标记一批图像,将它们合并到主数据集中,训练模型的新版本,并将其推送到生产环境。每次完成这个循环,模型都会继续改进。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485