2

深度学习目前受到了追捧。人们想将神经网络应用到各个地方,但是它们真的适合每个地方吗?在本篇文章中,将对于这个问题以及深度学习现在如此受追捧的原因进行讨论。

通过这篇文章,您将了解神经网络的主要缺点,阅读完它后,您将知道神经网络的主要缺点,当您为当前的机器学习问题选择正确类型的算法时,您将有一个大致的指导原则。

目录:

  1. 为什么深度学习被如此大肆宣传(数据,计算能力,算法,市场营销)。
  2. 神经网络与传统算法(黑盒子,开发持续时间,数据量,计算成本昂贵)。
  3. 结论。

为什么深度学习被如此大肆宣传?

1. 数据

深度学习之所以如此受欢迎是因为在2018年有大量的在过去几年或者几十年中收集得到的可用数据。神经网络获得的数据越多,越能发挥他们的潜力。

相比之下,传统的机器学习算法则将要达到一个饱和水平,更多的数据并不能提高其性能。下面的图说明了这一点:

clipboard.png

2. 计算能力

另外一个非常重要的原因是当前可用的计算能力,使我们能够处理更多的数据。根据人工智能的领先人物Ray Kurzweil 的观点,计算能力发展速度是在每个时间单位乘以一个常数因子(例如,每年增加一倍)。也就是说计算能力呈指数增长而不是逐渐增加。

3. 算法

深度学习之所以备受关注的第三个因素是算法本身的进步。算法开发中的这些最近的突破主要是使它们比以前运行得更快,这使得使用越来越多的数据成为可能。

4. 营销

营销也很重要。神经网络已经存在了几十年来(1994年被第一次提出),最初也对其进行了宣传,但是那个时代没有人相信、投资这一领域。“深度学习”这个词组给了它一个新的花哨的名字,这使得新的宣传成为可能,这也是许多人错误地认为深度学习是一个新创造的领域的原因。

此外,其他因素也为深度学习的营销做了贡献:例如汉森机器人技术有争议的“人形”机器人Sophia,以及机器学习主要领域的几项突破。

神经网络与传统算法

应该使用神经网络还是传统的机器学习算法?这是一个很难回答的问题,因为它很大程度上取决于你要解决的问题。这表明,世界上没有“完美”的机器学习算法,能够在任何问题上都表现的出色。这也是您需要精通几种算法的原因,以及为什么大量的练习训练是获得优秀机器学习工程师或数据科学家的唯一方法。尽管如此,神经网络的主要优势在于其几乎超越其他所有机器学习算法的能力,但是这有一些缺点,我们将在本文中讨论并重点关注。

1. 黑盒子

clipboard.png

神经网络最可能被人知晓的缺点是它们的“黑盒子”性质(也就是说你不知道神经网络是如何以及为什么会产生一定的输出)。例如,当你将一张猫的图像放入神经网络,预测结果显示它是一辆汽车时,这让人很难理解。而在某些领域,可解释性非常重要。

很多银行之所以不使用神经网络来预测一个人是否有信誉,是因为他们需要向客户解释为什么他们没有获得贷款。像Quora这样的网站也是如此。如果他们因为机器学习算法而决定删除用户账户,他们需要向用户解释为什么这样做。

如果将机器学习运用与重要的商业决策时,你能想象一个大公司的首席执行官会在不明白为什么应该完成的情况下做出数百万美元的决定吗?仅仅因为“计算机”说他需要这样做?

2. 发展的可持续时间

clipboard.png

虽然有像Keras这样的库,让神经网络的开发变得相当简单,但有时您需要更多地控制算法的细节。您可能还会使用到Tensorflow,但是由于它相对复杂,开发需要的时间也更长。对于公司管理层来说,如果用简单的算法就可以更快地解决问题,则让他们花高昂的费用和较长的时间去开发一些东西,显然是不合适的。

3. 数据量

与传统的机器学习算法相比,神经网络通常需要更多的数据,至少需要数千数百万个标记样本。而如果使用其它算法,许多机器学习问题可以用较少的数据很好地解决。

虽然在某些情况下,神经网络需要处理少量数据(大多数情况下它们不需要)。而像朴素贝叶斯这样的简单算法也可以很好地处理少数数据。

clipboard.png

4. 计算代价高昂

通常,神经网络比传统算法的计算代价更高。对于最先进的深度学习算法,完成深度神经网络从头到尾的完整训练,可能需要几周的时间。而大多数传统的机器学习算法则只需要少于几分钟到几个小时或几天的时间即可。

神经网络所需的计算能力很大程度上取决于数据的大小,同时也取决于网络的深度和复杂程度。

结论

在我看来,深度学习目前有点过度宣传。但并不是说它毫无用处,我认为这是一个机器学习复兴的时代,它的开放性和民主化,让越来越多的人可以用它来构建有用的产品。机器学习可以解决很多问题,我相信这将在未来几年内发生。

但是还存在一个问题:只有少数人了解可以用它做些什么,并知道如何建立成功的数据科学团队,为公司带来真正的价值。虽然我们拥有机器学习背后的理论天才博士级工程师,但他们不懂商业方面的东西。虽然我们有首席执行官和管理职业的人员,但是他们不知道深度学习可以做些什么。在我看来,我们需要更多的人才来填补这个空白,从而产生更多对我们社会有用的产品。

本文由阿里云云栖社区组织翻译。

文章原标题《Pros and Cons of Neural Networks》
作者:Niklas Donges

详情请阅读原文


阿里云云栖号
27.8k 声望35.7k 粉丝

阿里云官网内容平台