人工神经网络(Artificial Neural Network,简称ANN)是一种强大的机器学习技术,擅长于信息处理、发现新模式以及近似复杂过程。它们在处理大型和高度复杂的机器学习任务方面表现出色,例如驱动语音识别服务(如苹果的Siri)、每天向数百万用户推荐最佳视频(如YouTube)或分类数十亿图像(如谷歌图片)。
1958年,心理学家Frank Rosenblatt首次发明了神经网络,名为感知机(Perceptron),旨在模拟人脑处理视觉数据和识别物体的能力。在深入了解神经网络如何工作之前,最好先理解它们是如何受到大脑启发的。
人工神经网络的设计灵感来源于动物大脑的工作方式。大脑是一个复杂的神经元网络,每个神经元都向其他神经元传递信息,并处理感觉输入,将其转化为思想和行动。每个神经元通过其树突接收电输入,树突是将电信号从突触(与前一个神经元的连接点)传播到细胞体(神经元主体)的细胞纤维。如果累积的电刺激超过特定阈值,细胞就会被激活,并通过细胞的轴突(神经元的输出电缆)将电冲动传播到下一个神经元。因此,每个神经元都可以被视为一个非常简单的信号处理单元,当它们堆叠在一起时,可以实现思想和行动。
人工神经网络由称为神经元的个体单元组成。这些神经元被设计成模仿人脑的行为。神经元的关键组成部分如下:
1. 输入:输入是输入模型用于学习的特征。在图像分类中,输入可以是与图像相关的像素值数组。
2. 权重:权重是一个参数,它决定了输入对输出的影响程度。不重要的输入将被缩小,而重要的输入将被放大。例如,在情感分析模型中,负面词汇将比中性词汇对决策产生更深远的影响。
3. 偏置:偏置的作用是控制节点的激活。偏置可以延迟激活,也可以加速激活。
4. 传递函数:传递函数的作用是将加权输入组合到输出中,以便可以应用激活函数。