在数据科学领域,机器学习项目是如何运作的?构成机器学习或人工智能(AI)系统的不同构建模块是什么?这是在该领域初期个人遇到的难题之一。了解如何构建机器学习模型,但对于实际的机器学习项目如何运作却一无所知。当深入了解这一过程后,发现大多数数据科学和机器学习的初学者也难以掌握机器学习系统的细微差别。记住——不仅仅是构建模型!创建成功的机器学习和AI系统涉及很多方面,它是硬件和软件的融合,等等。那么,构成成功的机器学习系统的关键构建模块是什么呢?本文将详细讨论这些不同的组件,并以自动驾驶汽车为例来帮助理解这些组件。
正如可能预期的那样,每个机器学习系统都需要大量的数据才能运作。最终,它将根据捕获的数据做出决策。它需要捕获关于其所在环境、环境条件、用户输入等的数据。因此,任何机器学习或AI系统的第一个构建模块就是它如何捕获和输入系统的方式。那么,这种输入是什么样子的呢?这可能包括各种传感器,如摄像头捕获图像、GPS定位、移动应用程序的用户输入等。为了选择正确的输入,需要问这些关键问题:需要捕获什么数据?需要多频繁地捕获这些数据?数据流的速度有多快?捕获这些数据的最佳方式是什么?有时,可能有多种方式捕获相同的数据。例如,可能依赖汽车中的传感器来捕获天气信息,或者可以直接根据汽车的GPS坐标从互联网上获取它们。在决定更喜欢哪种方式之前,可能需要权衡各种捕获数据方式的利弊。