在机器学习领域,初学者和新入门者常常会遇到一个普遍的问题:如何区分监督学习与无监督学习?理解这两种学习方式的本质是深入机器学习算法核心的关键。如果不能清晰地区分它们,学习之旅将无法顺利进行。实际上,这是在开始机器学习之旅时应该首先学习的内容之一。如果不理解线性回归、逻辑回归、聚类、神经网络等算法属于哪种学习方式,就不能简单地跳入模型构建阶段。如果不知道机器学习算法的目标是什么,将无法构建准确的模型。这就是监督学习与无监督学习的概念所在。
监督学习是一种通过示例教导计算机的学习方式。它从过去的数据中学习,并应用这些学习来预测未来事件。在这种情况下,输入和期望的输出数据都有助于预测未来事件。为了进行准确的预测,输入数据被标记或标记为正确答案。
所有监督学习算法本质上都是复杂的算法,被归类为分类或回归模型。
监督学习算法在现实生活中有一些非常实际的应用,包括:
另一方面,无监督学习是一种训练机器使用未经分类或标记的数据的方法。这意味着没有提供训练数据,机器必须自己学习。机器必须能够在没有任何关于数据的先验信息的情况下对数据进行分类。
这个想法是让机器接触大量不同的数据,并允许它从这些数据中学习,以提供以前未知的洞察,并识别数据集中隐藏的模式。因此,无监督学习算法并不一定有明确定义的结果。相反,它确定数据集中什么是不同或有趣的。
机器需要被编程为自学。计算机需要理解并从结构化和非结构化数据中提供洞察。这里是一个无监督学习的准确示例:
无监督学习算法的一些实际应用包括:
在制造业中,许多因素影响哪种机器学习方法最适合任何给定的任务。而且,由于每个机器学习问题都是不同的,决定使用哪种技术是一个复杂的过程。
一般来说,确定正确的机器学习方法的一个好策略是: