提到“机器学习”这个词,许多人可能会联想到电影《终结者:机器的崛起》,其中Skynet将人类视为威胁,制造了一支终结者(T-100型号)军队,最终通过在全球范围内引发核武器的混乱来毁灭人类。这确实是一部好电影,但要见到真正的T-100,肯定还有很长的路要走。
在这篇文章中,将探讨机器学习究竟是什么,以及它为何在当今如此流行。这篇文章是为那些刚刚开始接触机器学习世界的人准备的。将其视为一份面向初学者的机器学习指南。在博客的最后,还创建了一个常见问题解答(FAQ)部分,以回答一些关于机器学习的常见问题。那么,让开始吧。
如果对数据科学领域的职业感兴趣,并希望开始学习这些算法和技术,并与行业相关的项目相结合,请查看Certified AI & ML BlackBelt Accelerate
程序。
什么是机器学习?
在以简化的方式理解机器学习的含义之前,让先看看机器学习的正式定义。
定义1:机器学习
在其最基本的形式上,是使用算法来解析数据,从中学习,然后对世界上的某件事情做出决定或预测。——NVIDIA
定义2:机器学习
是让计算机在没有被明确编程的情况下采取行动的科学。——斯坦福大学
定义3:机器学习
是基于算法的,这些算法可以从数据中学习,而不需要依赖基于规则的编程。——麦肯锡公司
定义4:机器学习
算法可以通过从示例中泛化来弄清楚如何执行重要任务。——华盛顿大学
以上所有定义在技术上都是正确的,并且由该领域的专家提供。然而,对于那些刚开始学习机器学习的人来说,这些定义可能感觉有点难以理解。由于这是一份面向初学者的机器学习指南,让以一种初学者的方式创建自己的机器学习定义。
简化的机器学习定义:机器学习是机器自学的能力。
等等,就这样吗?这就是机器学习的定义吗?
是的,在通俗的术语中,这就是机器学习的定义。现在如何得出这个定义,机器如何学习,以及它如何解决世界上一些最棘手的问题,是接下来将要探讨的内容。
机器学习的解释
那么机器学习是如何工作的。好吧,让给看一张图片。
在这里看到了什么?可以看到那里有两个机器人,让称它们为机器。那里有人正在教这些机器。嗯,这就是机器学习的精髓。在机器学习中,不会明确地编码机器如何解决特定问题。相反,赋予机器能力,让它自己弄清楚问题并尝试自己解决。
机器学习的要素
对于任何机器学习算法要正常工作,需要四个要素。
1.数据:提供给机器学习算法的输入数据
2.模型:将要构建的机器学习算法
3.目标函数:衡量预测输出与实际输出有多接近
4.优化算法:一系列试验的循环
为了更快速地解释这些术语,将在解释机器学习类型的同时解释这些要素。
根据机器学习过程的发生方式,机器学习被分为三个主要类别。
1.监督学习
2.无监督学习
3.强化学习
注意:在这篇文章中,将向解释监督学习、无监督学习和强化学习。
让用一张图片来理解监督学习。
假设这张图片中的人是,机器人是朋友,称他为Chuck。正在和Chuck玩“猜水果”游戏。在这个游戏中,会向Chuck展示一些水果的图片,而Chuck则会猜测那是什么水果。
现在让从以下角度来理解监督学习:
1.数据:在这里,手里拿着一些水果的图片,这就是数据。
2.模型:朋友Chuck是模型。从技术上讲,模型可以是任何东西。它就像一个算法或函数或回归方程一样简单。
3.目标函数:这是用来计算Chuck的结果与实际结果有多接近的东西。
4.优化算法:在多次玩这个游戏之后,决定升级Chuck的CPU、RAM和图像传感器,以便它能够更清晰地看到图像,并且由于更快的CPU和RAM可以更快地处理这些图像。让将这些步骤视为算法,现在这是优化算法。
现在的问题是,为什么这被称为监督学习?
嗯,从图片本身来看就很清楚了。向Chuck展示图片,然后检查它是否给出了回应。如果它猜对了,就回答是,否则就回答不是。简而言之,正在监督Chuck正确识别图片中显示的水果,这就是为什么它被称为监督学习。
让用一张图片来理解无监督学习。
和Chuck都很喜欢玩猜水果游戏。然而,有一个重要的办公室会议要赶上。与此同时,为了保持Chuck的忙碌,给了他另一个游戏。这次在桌子上放了一张有一些水果的图片,并告诉Chuck对这些水果进行分类,然后去开会了。
现在让从以下角度来理解无监督学习:
1.数据:有各种水果的图片
2.模型:Chuck本身
3.目标函数:Chuck是否正确地对水果进行分类?
4.优化算法:——
由于在开会,Chuck必须自己玩这个游戏。但这次,在看到这些图片后,Chuck感到困惑,不知道如何对它们进行分类。Chuck现在感到困惑,并开始自己进行这项活动。
现在的问题是,为什么这被称为无监督学习?
嗯,再次从图片本身来看就很清楚了。由于在开会,没有人监督Chuck,它需要自己弄清楚。缺乏监督,因此这被称为无监督学习。
可能想问的一件事是为什么没有提到优化算法。原因是在无监督学习中,由于没有监督机器如何解决问题,机器必须自己弄清楚并执行自己的优化。
让用一张图片来解释机器学习的最后一个话题。
强化学习很难解释。让试着用上面的例子来解释这个。
想象一下,正在教狗,称它为Fido,去取一根棍子。每次当Fido成功地取回棍子时,就会给它一个奖励(一根骨头,比如说)。最终,Fido认识到了这个模式,每次当扔一根棍子时,它都会尽快地去取,以获得奖励(一根骨头),结果取棍子的时间越来越少。
嗯,这就是强化学习的精髓。
1.机器学习中的模型是什么?
在通俗的术语中,模型可以是任何东西。它可以是在R或Python中实现的机器学习算法,也可以是一个简单的数学方程。
2.数据对于机器学习算法的运作是必要的吗?
是的,大量的数据对于机器学习算法的运作是必要的。没有数据,就没有机器学习。
计算机科学 ->数据科学-> 机器学习
4.何时使用哪种类型的机器学习算法?
这很难决定。这个问题没有具体的答案。它完全取决于试图解决的问题类型。但简而言之,
1.监督学习:例如回归、分类
2.无监督学习:例如聚类
3.强化学习:例如自动驾驶汽车
5.用于构建机器学习算法的语言是什么?
这完全取决于想使用哪种编程语言。如果一种编程语言比另一种提供更好的功能,那么使用那个。没有对错之分。
如果喜欢这篇文章,请通过电子邮件分享反馈。
Shrish Mohadarkar