机器学习入门指南

提到“机器学习”这个词，许多人可能会联想到电影《终结者：机器的崛起》，其中Skynet将人类视为威胁，制造了一支终结者（T-100型号）军队，最终通过在全球范围内引发核武器的混乱来毁灭人类。这确实是一部好电影，但要见到真正的T-100，肯定还有很长的路要走。

在这篇文章中，将探讨机器学习究竟是什么，以及它为何在当今如此流行。这篇文章是为那些刚刚开始接触机器学习世界的人准备的。将其视为一份面向初学者的机器学习指南。在博客的最后，还创建了一个常见问题解答(FAQ)部分，以回答一些关于机器学习的常见问题。那么，让开始吧。

如果对数据科学领域的职业感兴趣，并希望开始学习这些算法和技术，并与行业相关的项目相结合，请查看Certified AI & ML BlackBelt Accelerate程序。

什么是机器学习？

在以简化的方式理解机器学习的含义之前，让先看看机器学习的正式定义。

定义1：机器学习在其最基本的形式上，是使用算法来解析数据，从中学习，然后对世界上的某件事情做出决定或预测。——NVIDIA

定义2：机器学习是让计算机在没有被明确编程的情况下采取行动的科学。——斯坦福大学

定义3：机器学习是基于算法的，这些算法可以从数据中学习，而不需要依赖基于规则的编程。——麦肯锡公司

定义4：机器学习算法可以通过从示例中泛化来弄清楚如何执行重要任务。——华盛顿大学

以上所有定义在技术上都是正确的，并且由该领域的专家提供。然而，对于那些刚开始学习机器学习的人来说，这些定义可能感觉有点难以理解。由于这是一份面向初学者的机器学习指南，让以一种初学者的方式创建自己的机器学习定义。

简化的机器学习定义：机器学习是机器自学的能力。

等等，就这样吗？这就是机器学习的定义吗？

是的，在通俗的术语中，这就是机器学习的定义。现在如何得出这个定义，机器如何学习，以及它如何解决世界上一些最棘手的问题，是接下来将要探讨的内容。

机器学习的解释

那么机器学习是如何工作的。好吧，让给看一张图片。

在这里看到了什么？可以看到那里有两个机器人，让称它们为机器。那里有人正在教这些机器。嗯，这就是机器学习的精髓。在机器学习中，不会明确地编码机器如何解决特定问题。相反，赋予机器能力，让它自己弄清楚问题并尝试自己解决。

机器学习的要素

对于任何机器学习算法要正常工作，需要四个要素。

1.数据：提供给机器学习算法的输入数据

2.模型：将要构建的机器学习算法

3.目标函数：衡量预测输出与实际输出有多接近

4.优化算法：一系列试验的循环

为了更快速地解释这些术语，将在解释机器学习类型的同时解释这些要素。

根据机器学习过程的发生方式，机器学习被分为三个主要类别。

1.监督学习

2.无监督学习

3.强化学习

注意：在这篇文章中，将向解释监督学习、无监督学习和强化学习。

让用一张图片来理解监督学习。

假设这张图片中的人是，机器人是朋友，称他为Chuck。正在和Chuck玩“猜水果”游戏。在这个游戏中，会向Chuck展示一些水果的图片，而Chuck则会猜测那是什么水果。

现在让从以下角度来理解监督学习：

1.数据：在这里，手里拿着一些水果的图片，这就是数据。

2.模型：朋友Chuck是模型。从技术上讲，模型可以是任何东西。它就像一个算法或函数或回归方程一样简单。

3.目标函数：这是用来计算Chuck的结果与实际结果有多接近的东西。

4.优化算法：在多次玩这个游戏之后，决定升级Chuck的CPU、RAM和图像传感器，以便它能够更清晰地看到图像，并且由于更快的CPU和RAM可以更快地处理这些图像。让将这些步骤视为算法，现在这是优化算法。

现在的问题是，为什么这被称为监督学习？

嗯，从图片本身来看就很清楚了。向Chuck展示图片，然后检查它是否给出了回应。如果它猜对了，就回答是，否则就回答不是。简而言之，正在监督Chuck正确识别图片中显示的水果，这就是为什么它被称为监督学习。

让用一张图片来理解无监督学习。

和Chuck都很喜欢玩猜水果游戏。然而，有一个重要的办公室会议要赶上。与此同时，为了保持Chuck的忙碌，给了他另一个游戏。这次在桌子上放了一张有一些水果的图片，并告诉Chuck对这些水果进行分类，然后去开会了。

现在让从以下角度来理解无监督学习：

1.数据：有各种水果的图片

2.模型：Chuck本身

3.目标函数：Chuck是否正确地对水果进行分类？

4.优化算法：——

由于在开会，Chuck必须自己玩这个游戏。但这次，在看到这些图片后，Chuck感到困惑，不知道如何对它们进行分类。Chuck现在感到困惑，并开始自己进行这项活动。

现在的问题是，为什么这被称为无监督学习？

嗯，再次从图片本身来看就很清楚了。由于在开会，没有人监督Chuck，它需要自己弄清楚。缺乏监督，因此这被称为无监督学习。

可能想问的一件事是为什么没有提到优化算法。原因是在无监督学习中，由于没有监督机器如何解决问题，机器必须自己弄清楚并执行自己的优化。

让用一张图片来解释机器学习的最后一个话题。

强化学习很难解释。让试着用上面的例子来解释这个。

想象一下，正在教狗，称它为Fido，去取一根棍子。每次当Fido成功地取回棍子时，就会给它一个奖励（一根骨头，比如说）。最终，Fido认识到了这个模式，每次当扔一根棍子时，它都会尽快地去取，以获得奖励（一根骨头），结果取棍子的时间越来越少。

嗯，这就是强化学习的精髓。

1.机器学习中的模型是什么？

在通俗的术语中，模型可以是任何东西。它可以是在R或Python中实现的机器学习算法，也可以是一个简单的数学方程。

2.数据对于机器学习算法的运作是必要的吗？

是的，大量的数据对于机器学习算法的运作是必要的。没有数据，就没有机器学习。

3.机器学习在数据科学领域中的位置是什么？

计算机科学 ->数据科学-> 机器学习

4.何时使用哪种类型的机器学习算法？

这很难决定。这个问题没有具体的答案。它完全取决于试图解决的问题类型。但简而言之，

1.监督学习：例如回归、分类

2.无监督学习：例如聚类

3.强化学习：例如自动驾驶汽车

5.用于构建机器学习算法的语言是什么？

这完全取决于想使用哪种编程语言。如果一种编程语言比另一种提供更好的功能，那么使用那个。没有对错之分。

如果喜欢这篇文章，请通过电子邮件分享反馈。

Shrish Mohadarkar

机器学习入门指南

什么是机器学习？

机器学习的解释

机器学习的要素

探索性数据分析（EDA）指南

TensorFlow 3D：深度学习在3D场景理解中的应用

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485

机器学习入门指南

什么是机器学习？

机器学习的解释

机器学习的要素

探索性数据分析（EDA）指南

TensorFlow 3D：深度学习在3D场景理解中的应用

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢 联系电话：17898875485

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：17898875485