机器学习(ML)是一个高度迭代的过程,它依赖于过去的经验和历史数据来学习,并能够识别数据中的模式,以便对未来的数据集做出预测。
在当前的数字世界中,5V(体量、多样性、变化速度、可见性和价值)占据主导地位,因此大多数行业都在开发各种模型来分析其在市场上的存在和机会。基于这些结果,他们能够大规模地向客户交付最佳的产品和服务。
机器学习(ML)在许多行业和领域中都有广泛的应用,其过程的实施和改进也在不断进行。目前,ML已经在多个领域和行业中发挥作用,没有界限。下图展示了ML发挥重要作用的领域。
通过观察维恩图,可以了解ML在人工智能领域中的位置以及它与其他人工智能组件的关系。
机器学习过程是ML过程的第一步,它从多个来源获取数据,然后经过精细调整的数据过程,这些数据将成为基于问题声明的ML算法的输入,如预测、分类和其他模型。让逐一讨论每个过程。
可以将ML过程的阶段分为以下五个,如下流程图所示。
数据收集可以是内部和/或外部的,以满足业务需求/问题。数据可以是任何格式,如CSV、XML、JSON等,大数据在这里扮演着重要角色,确保正确的数据以预期的格式和结构存在。
这个阶段的主要目标和重点是: