天才一秒记住【久久文学】地址:https://www.jjwxx.com
但当时吸引大多数读者注意力的,是明斯基和帕普特的研究表明,感知器模型不能学习一个很简单的逻辑概念——异或(XOR)[11]。
举一个例子,假设你的网络只有两个输出,当其中一个输出被激活时,异或函数应该产生一个输出(但当两个输入同时被激活的时候,则不会产生输出)。
要证明单层感知器无法表示异或状态很容易,感兴趣的读者可以在附录D中找到更多信息。
明斯基和帕普特的书似乎给出了相当全面的结论,不过时至今日仍然存有争议。
该理论结果证明了某些类别的感知器在基础结构层面具有严重局限性,这似乎就意味着基于感知器的通用模型存在局限性。
而如图16所示的多层感知器并不受这些限制:从精准的数学定义来说,可以证明多层感知器完全能够普遍适用。
然而,在当时,没人知道该如何训练一个具有多层感知器的网络:它只是一个理论上可能出现的网络结构,在现实中无法构造。
20年后,随着科学的发展,它才从理论走向实践。
我很怀疑,当年对感知器太过激进的宣传间接导致了对它的负面结论下得如此武断。
比如,1958年《纽约时报》上某篇文章兴奋地报道[64]:
美国海军今天公布了一个电子计算机雏形,人们期望它能够行走、说话、视物、书写、自我复制,并且意识到自己的存在。
对于神经网络研究衰落的确切原因,我们可以展开各种辩论,但不管是什么,到了20世纪60年代末,神经网络研究急剧衰落。
人们转而支持麦卡锡、明斯基和西蒙倡导的符号人工智能的方式(讽刺的是,神经网络研究的衰落仅仅发生在人工智能寒冬——我们在第二章里提到过——出现的前几年)。
1971年,罗森布拉特死于一次航海事故,使得神经网络研究领域失去了一员主力大将。
如果他能活下来,人工智能的历史也许会有所不同。
总之,在他死后,神经网络的研究被搁置了十多年。
连接主义(神经网络2.0)
神经网络研究领域一直处于休眠状态,直到20世纪80年代才开始复苏。
一本分上下两册出版的书籍《并行分布式处理》[65],预示着神经网络研究领域的复兴。
并行和分布式处理(简称PDP)是计算机科学研究的一个主流领域,它主要研究如何建立能够并行运算的计算机系统。
乍一看,这本书跟人工智能或者神经网络毫无关联,而且我想某些看了书名就买书的人,在发现本书的内容和神经网络有关的时候,会感到无比困惑。
或许作者选择这个标题就是为了跟之前的神经网络研究撇清关系吧。
从某种意义上来说,新兴研究的最重要部分也没那么新颖:它主要研究多层神经网络,可以轻易克服明斯基和帕普特所断定的简单感知器系统的局限性。
不过跟之前的研究仍然有一点关键的区别。
以前关于感知器的研究主要集中在单层网络上,因为当时没有人知道如何“训练”
多层神经网络,也不知道如何找出神经元之间连接的权重值。
PDP以一种被称为反向传播的算法为这个问题提供了解决方案,这或许是神经网络领域中最重要的一门技术。
就如科学研究中经常发生的情况一样,反向传播似乎在过去的几年里被发明和重新发明过很多次,但是PDP研究人员引入的特定方法最终确定了它的地位[66]。
如果要完整地解释反向传播算法,我们必须引入本科水准的微积分知识,这远远超出了本书设定的范围。
不过反向传播算法的基本思想很简单,它的工作原理是收取神经网络出错的反馈,这里的错误是在网络的输出层的输出(比如网络输入了一张猫的图片,而输出层将其归类为一条狗)。
反向传播算法将错误从输出端向输入端逐层逆向修正(算法也是因此而得名的)。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!