深度学习概览与应用

在最近的研究中,意识到需要更深入地理解深度学习。这个术语可能在去年晚些时候引起了注意,并且自那以后,它在周围的影响力不断增强。为了验证这是否是一个全球性的现象,而不仅仅是基于搜索历史或过去行为的特定内容,查看了谷歌趋势中的深度学习数据。结果显而易见,正在追赶一个新的趋势。因此,让根据在过去几天阅读的内容,总结对这个话题的发现和看法。

可能已经猜到了,不是深度学习方面的专家(呼!)。但是,比大多数人更有动力去了解它们。希望为初学者提供一个有意义的总结,并向专家们提出一些发人深省的问题。如果对这个话题有任何问题/意见,请在下面的评论中添加。

什么是深度学习?

深度学习可能是当今机器学习中最热门话题之一,并且它在某些方面已经显示出比它的对手更显著的改进。它属于无监督学习算法的一类,并且使用多层神经网络来实现这些非凡的结果。以下是来自分析存储博客的一个简单插图:大量像素作为输入被送入网络,之后网络学习并演变为识别更高级别的特征,如面部和猫。

以下是一些成就,推动了对这个领域的关注:

  • 在许多Kaggle竞赛中取得了惊人的准确性——猫狗图像识别(98.9%的准确性),拯救鲸鱼问题(98%的准确性)
  • 能够在没有任何监督的情况下,通过YouTube视频识别猫

以下是一些事件,表明对深度学习知识人才的需求:

  • 谷歌收购Deepmind Technologies
  • 谷歌聘请了这个领域的思想领袖之一杰夫·欣顿(可以在Coursera上查看他的神经网络课程)

深度学习的应用

如果还没有意识到,深度学习在以下领域找到了它的应用:

  • 图像识别(例如,在照片中标记面部)
  • 语音识别(例如,基于语音的搜索,Siri)
  • 模式检测(例如,手写识别)

但是,神经网络已经存在了几十年,为什么现在又重新引起了兴趣呢?是的,神经网络已经存在了很长时间。神经网络的兴趣在1980年代和1990年代达到了高峰,然后因为它们固有的问题和黑箱方法而消失。现在有几个原因导致了这种情况的发生。其中最大的一个原因是计算成本的降低。通过在谷歌实验室部署16,000台计算机,实现了通过无监督学习YouTube视频对猫进行分类!即使按照今天的标准,部署这些算法的成本也不小。

深度学习资源

以下是一些好的资源列表,如果对这个领域感兴趣,可以开始阅读/关注:

  • 及其教程
  • 杰夫·欣顿的Coursera神经网络课程
  • Google+社区
  • 杨立昆对深度学习的概述
  • 深度学习的完整学习路径

心中还有一些问题:

  • 这看起来像是一个巨大的黑箱来处理(类似于随机森林的放大版本),它可能在数据科学竞赛中表现良好,但未能提供任何商业理解。它对更广泛的社区有用和有影响力,还是只停留在数据巨头的实验室中,处理庞大的数据集?例如,模型可能会将某个人归类为可能的违约者,但不会解释为什么会这样做。
  • 这些方法已经显示出一些难以解释的缺陷。根据最近的一项研究,算法能够对下图左侧的图像进行分类,但无法对右侧的图像进行分类——这些图像对人类眼睛来说可能看起来非常相似。(来源:,原始案例研究)
  • 过拟合/选择正确的算法——鉴于这些算法的性质,正在构建多个中间(隐藏)层在架构中。这些在具有无限(或非常大)自由度的问题上会表现良好。然而,如果有有限的自由度,可能会最终得到一个过拟合的模型——可能是时候回到传统方法了。

必须承认,开始研究时,这些算法看起来更像是一个热门话题。但是鉴于数据巨头的关注,一些Kaggle竞赛的成功和计算成本的降低,开始相信这个领域的热度是有道理的。

它是否真的有道理,只有时间会告诉。与此同时,将继续研究,并在这里更新进展。为了在神经网络中获得专业知识,尝试深度学习实践问题——

识别数字

对深度学习有什么看法?认为它会改变人们对当今机器学习的看法吗?或者认为这可能只是另一个炒作?人们将如何解决在文章中提到的一些挑战?请通过下面的评论告诉想法。

如果喜欢刚刚阅读的内容,并希望继续分析学习,

  • 订阅电子邮件
  • 在Twitter上关注
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485