随着IBM视觉识别服务的即将关闭,许多用户正在寻找替代方案。本文将指导如何从IBM视觉识别导出数据,并提供了一个购买指南,帮助比较IBM视觉识别与其他产品(包括Roboflow)的差异,以便能够无缝地继续计算机视觉项目。
为了确保计算机视觉项目能够持续进行,需要尽可能多地从IBM导出进度。理想情况下,这意味着至少需要将数据(图像和注释)迁移到新平台,以便可以从中断的地方继续工作。
从IBM Watson中导出数据有几种不同的方法。
要从此服务导出数据,首先需要登录IBM开发者控制台以访问项目:。
选择当前的视觉识别项目。例如,项目名为“Visual Recognition-dx”。从这里,可以在控制台中搜索“Visual Recognition”以定位项目。
然后,选择“启动Watson Studio”。在这里,应该能够看到项目名称。点击它。
在顶部点击蓝色项目名称。这将带进入项目设置页面。在页面中部下方,应该能看到“在IBM Cloud中管理”。点击它。
从这里,应该能看到项目名称(是“chessprojectdetector-donotdelete-pr-iu5pdb7awzfdkc”)。点击项目名称。然后在下一页中,选择所有文件的复选框并点击“下载对象”。
这样,就可以将数据下载到任何其他工具中,例如Roboflow:。
或者,可以访问并选择项目。从这里,可以下载选择的格式的注释。
Roboflow接受这些格式中的任何一个,以便能够继续进度。请参阅:。
这使能够将IBM注释转换为YOLO、YOLOv5、TFRecords或任何其他格式。
在讨论如何从IBM迁移到Roboflow之前,列出了一些可能对和团队有帮助的标准。包括了适用于IBM视觉识别(已弃用)和IBM Maximo视觉检查的IBM Watson计算机视觉的比较。
主动学习是一种机器学习策略,它结合了一种有意识的(通常是模型辅助的)方法来策划训练数据。将主动学习想象为一种数据驱动(并且,好吧,主动的)方法,用于选择哪些图像最能提高模型性能。主动学习使计算机视觉模型能够在数据点减少10倍的情况下提高性能——从而在更短的时间内(并且标记更少)实现更高的模型性能。
支持主动学习的工具可以更快地交付结果。因此,考虑使用一个将正在生产的模型作为数据集策划和注释策略的活跃部分的平台。
主动学习需要一个端到端的平台:从数据集策划、组织、注释、训练到部署。
虽然IBM Maximo视觉检查和IBM视觉识别允许用户在标记数据时使用模型,但它们并没有将主动学习作为数据集策划的优先事项。使用正在生产的相同模型的平台。例如,想象一下,生产模型只将低于50%置信度的图像发送回训练数据集进行重新标记——这默认情况下使数据集能够快速改进。这就是像Roboflow这样的端到端工具如何默认地通过主动学习来实现的。
图像注释是创建高性能计算机视觉模型最耗时——但至关重要的部分之一。应该优先考虑创建一个无缝注释体验的平台,包括利用机器学习在注释过程中本身。
使用IBM Cloud Annotation和IBM视觉识别进行注释时,用户需要进行多次点击、滚动屏幕,并忍受保存等待时间。例如,以下是使用IBM注释两个国际象棋棋子:
用户必须点击、拖动、导航以添加类别、点击保存、等待,然后再次执行此操作。这大约需要用户20秒。
相比之下,以下是在Roboflow中添加相同的两个注释,用户只需要进行两次点击(总共),智能默认值建议注释名称,并且没有等待时间:
从同一位置开始,在Roboflow中添加两个相同的注释需要两次点击,大约需要七秒钟。
在这个例子中,在IBM中添加两个注释大约需要20秒,在Roboflow中需要大约7秒。在1000个注释的适度数据集中,这意味着在IBM中需要333小时,在像Roboflow这样的工具中需要116小时。团队会用额外的大约200小时做什么?
此外,利用模型辅助标记的平台使用计算机视觉本身自动向图像添加注释。这意味着自动化注释——有时在经验中高达70-80%。像IBM和Roboflow这样的平台默认情况下都包含这种能力,尽管许多开源工具并不具备。
团队应该能够在需要的任何地方使用他们的模型:通过云托管的API、在边缘设备上(如NVIDIA Jetson)或甚至在浏览器中(如TensorFlowJS)。
IBM视觉识别允许用户下载他们的模型并通过API托管。它没有提供到移动设备或浏览器的简单边缘部署,让团队不得不在内部重建这个视觉基础设施。
平台应该使开发人员能够在需要的地方使用他们的模型,甚至可以无缝地在云API或设备策略之间进行实验。(像Roboflow这样的平台包括一个完全托管的和可扩展的Web API,一个三行代码部署到边缘设备如NVIDIA Jetsons,甚至在设备上的浏览器模型。)
核心在于,开发团队使用的工具可以逐步改变开发者的生产力。因此,强调开发者体验的平台应该是一个关键的考虑因素。
评估开发者体验本质上是一个主观的游戏,但有一些措施需要考虑。
尝试这个工具。这里的第一项测试是这个工具是否对用户开放注册。不允许用户注册甚至免费版本而必须,例如,与销售团队交谈的工具可能没有将开发者本身作为他们的目标用户。不直观的用户体验会消耗生产力。记住,购买这个工具是为了提高输出的质量和/或数量。
其次,当自己评估这个工具时,请确保能够快速达到一个生产就绪的最终状态。在Roboflow,经常看到团队在几天内——而不是几周内——建立生产就绪的模型,甚至在没有与团队交谈以开始的情况下。
确保公司强调文档。这包括以文档为先导,文档的易读性和保持最新。(这里是。)
确定这个工具是否正在构建开发者社区。与文档相关,培养用户社区表明公司致力于响应和迭代反馈。它还为开发者创造了一个开放的空间,让他们可以互相帮助——从而提高整体社区生产力。(在Roboflow,维护一个非常活跃的博客——👋好——和YouTube频道,以参与、教育和响应社区。)