在机器学习领域,效率和速度是衡量一个库性能的重要指标。IBM和Google两大科技巨头在这一领域的竞争日趋激烈。IBM宣称,其POWER服务器上执行机器学习任务的速度是Google Cloud的46倍。这一声明引起了业界的广泛关注。
今年早些时候,Google的一名软件工程师在其博客中分享了如何使用Google Cloud Machine Learning和TensorFlow解决点击预测问题。他们训练了一个深度神经网络模型,用于预测Criteo Labs点击日志中的显示广告点击。这些日志数据超过1TB,包含了数百万显示广告的特征值和点击反馈。
在Google的案例中,数据预处理花费了大约一个小时,随后模型训练耗时70分钟。评估损失报告为0.13。尽管他们设法降低了评估损失并获得了更准确的结果,但这是以增加训练时间为代价的。
IBM的研究者们在POWER9服务器和GPU上运行的训练算法,在初始训练阶段超越了Google Cloud Platform。IBM的研究者们同样使用了Criteo Labs点击日志作为数据源,该数据集包含了42亿个训练样本和100万个变量。他们采用了逻辑回归技术(与Google相同),但使用的是不同的机器学习库——Snap Machine Learning。
IBM的模型在91.5秒内完成了相同的逻辑回归,这比Google的尝试快了46倍。IBM在其研究论文中发布了Snap ML库与其他竞争对手的比较结果。