在一篇宣布MLflow发布的中,Databricks列出了他们决定开发这个工具的原因。他们看到了许多公司在管理机器学习工作流时遇到的问题。从数据准备到模型训练,数据科学家更喜欢使用各种工具来验证他们的系统有多好。这需要生产大量的库,这对大多数组织来说是不可能的。此外,复制工作流的步骤至关重要,但如果没有详细的跟踪,通常很难做到。当然,将模型投入生产是最难的部分。可能有许多工具和环境用于部署,没有标准的方法将模型从任何库移动到这些工具中的任何一个。
MLflow
可以与任何机器学习库、算法、部署工具或语言一起工作。它提供的其他优势包括:
MLflow
也可以与之一起使用!由于它是开源的,甚至可以在组织之间共享框架和模型(假设也想开源代码,显然)。团队正在努力添加更多组件,如监控模型的进度。现在可以使用pip
安装MLflow
:
pip install mlflow
该项目目前处于alpha版本,但开发人员认为它已经足够好,可以集成到组织当前的环境中。可以在上查看并关注他们的仓库。