在机器学习领域,团队可以选择专有程序如Knime或SageMaker,或者创建自己的开源服务。尽管企业经常将专有政策作为更具吸引力、更高效、更易于使用的卖点,但实际上,它们通常比开源选择更复杂、功能更有限。开源的理念与软件行业本身一样受到喜爱。最初的开源软件使用随着计算机工具的发展而变得普遍,以基本代码的形式出现。这些进步发生在学术界,其中基本的操作政策是协作和参与。
完全从开源组织创建了自己的MLOps结构。以下是为什么控制程序至关重要的原因。开源软件通常质量更高,甚至比付费替代品还要好。像谷歌和微软这样的大型公司在开源软件上投入巨大,并且经常有他们最熟练的工程师在这些项目上工作。开源项目也从比闭源选择更多的眼睛中受益。如果开发者发现了一个缺陷,他们可以提供一个修复,使每个人都受益。最终,开源软件通常不是用来销售的;决定性的激励措施更有益,因为功能是定义成功的关键时刻。
通过多样性,商业项目的成功可能更多地依赖于销售、合作伙伴关系和品牌。这表明公司通常被激励在这些措施上投入更多的时间和精力,而不是工程。开源旨在可互换的技能,这使得使用更容易。工程师需要发现开源工具,因为他们也可以在其他组织中使用这些信息。没有人愿意因为他们花费了十年时间学习某个特定平台的内外而被困在他们当前的工作中。
培训公司使用与其他组织相关的工具,如TensorFlow和Kubernetes,可能会让一些人感到恼火。然而,老实说,这是吸引顶尖工程人才的唯一可持续方式。团队也可以以多种方式从这些可转移的技能中受益:如果使用与其他所有人相同的工具,那么找到专业顾问甚至纯粹的社区支持指导要容易得多。
开源解决方案进一步模块化。“全面”是商业平台试图区分自己的一种重要方式。他们不是只构建一个教育平台,或者只构建一个部署设备,而是将自己作为“一站式”解决方案或“组织将需要的最后一台机器”来销售。但是,成为所有事物中最好的是不可靠的。这些解决方案的庞大现实使得更换不同组件变得更加困难。如果团队需要使用最合适的模型注册表,他们通常无法将其集成到他们当前的平台中。
相比之下,开源软件通常更细粒度,并且完全专注于与其他原则结合。这涉及到一个开源解决方案,更像是玩乐高:如果其中一部分给带来麻烦,可以将其拆下并更换为一个选项。在传统程序中存在看不见的成本。专有平台被激励不断地向现有客户销售升级和创新。在许多情况下,这意味着他们对他们的条件并不坦率。在交易中,他们可能会说服,一个低级或中级程序完全适合需求。只有在购买后,才会意识到他们策略性地提取了关键功能或添加了特定限制,旨在阻止工作流程,直到支付下一次升级。
这些平台还可以在几乎没有通知的情况下提高价格,所以工作人员要么努力重写一切,要么支付比计划的更高的价格。在什么情况下使用专有平台才有意义?如果公司没有太多的规划专业知识,特别是在DevOps和设计及维护基础设施方面,设置和管理开源解决方案可能会很困难。开源工具往往是由“开发者为开发者”开发的,所以非技术组织,如零售,有时也可能喜欢专有平台。
专有软件的挑战
最终决定
- Github
- Quora
- DataScience+
- ModularMachineLearning