MLflow:开源机器学习平台

在一篇宣布MLflow发布的中,Databricks列出了他们决定开发这个工具的原因。他们看到了许多公司在管理机器学习工作流时遇到的问题。从数据准备到模型训练,数据科学家更喜欢使用各种工具来验证他们的系统有多好。这需要生产大量的库,这对大多数组织来说是不可能的。此外,复制工作流的步骤至关重要,但如果没有详细的跟踪,通常很难做到。当然,将模型投入生产是最难的部分。可能有许多工具和环境用于部署,没有标准的方法将模型从任何库移动到这些工具中的任何一个。

MLflow的特点

MLflow可以与任何机器学习库、算法、部署工具或语言一起工作。它提供的其他优势包括:

  • 设计为与任何云一起工作
  • 与许多开源机器学习框架集成,包括Apache Spark、TensorFlow和SciKit-Learn
  • 与Apache Spark一起扩展到大数据
  • 如果有现有代码,MLflow也可以与之一起使用!由于它是开源的,甚至可以在组织之间共享框架和模型(假设也想开源代码,显然)。

当前版本的MLflow有三个组件:

  • 跟踪:用于查询和记录实验数据
  • 项目:提供一种简单的格式来复制代码
  • 模型:用于管理和将模型部署到生产中

团队正在努力添加更多组件,如监控模型的进度。现在可以使用pip安装MLflow

pip install mlflow

该项目目前处于alpha版本,但开发人员认为它已经足够好,可以集成到组织当前的环境中。可以在上查看并关注他们的仓库。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485