天才一秒记住【久久文学】地址:https://www.jjwxx.com
它首先计算误差值(即输出的数据和期望得到数据之间的差值),在给定输入和输出的情况下,误差是一个和权重有关的函数,需要通过修正权重值使得误差值达到极小(即尽量减少误差)。
根据误差值能够得到等值线图,在等值线图上体现为最陡的下降路线,即为从当前的误差到我们期望的最小误差的方法。
这个通过调整权重值来减少误差值,最终接近极小误差(即输出结果尽量接近期望输出)的过程被称为梯度下降。
然后,调整完最后一层权重以后,逐级往前调整,以此类推。
PDP还提供了比感知器更适用的神经元模型。
感知器模型本质上还是二进制的计算单元(状态为开或者关),而PDP的神经元模型更具备通用性。
反向传播算法的发展和PDP研究界引入的其他创新,使得神经网络具备广泛应用的可行性,这远远超出了20年前感知器模型的简单演示,人们对神经网络的发展兴趣倍增。
但事实证明,PDP的泡沫也没有持续太久。
到了90年代中期,神经网络研究再次失宠。
事后看来,神经网络车轮从PDP研究这辆马车上脱落的原因,并非研究基础有固有缺陷这类硬伤,而是源于一个平淡无奇的理由:当时的计算力不够强大,无法承载新技术。
并且,PDP的进步似乎十分缓慢,而机器学习的其他领域又在飞速发展,因此,机器学习的主流热点,又一次从神经模型上转移开了。
深度学习(神经网络3.0)
我想起2000年前后参与的一个学术人工智能特派专家组的经历。
小组的一位成员试图说服我们拒绝任何从事神经网络研究的申请人。
“这是一个富有影响力、充满机会的领域,”
他辩称,“我们为什么要雇用一个研究夕阳产业的人呢?”
不过我们忽视了他的意见。
但公正地说,在2000年,你必须具备非凡的远见卓识才能预测到神经网络即将再次复兴。
到了2006年前后,一场复苏确实开始了,它引起了人工智能史上规模最大、宣传最广的爆发。
推动第三次神经网络研究浪潮的关键技术被称为深度学习[67]。
我倒是很乐意告诉你深度学习可以用某个单一的关键理念描述出来,可惜,事实上,这个术语指代的是一系列相关思想的合集。
深度学习至少可以从三个不同的方面解读。
其中最重要的,顾名思义,就是网络要具备“深度”
,即多层结构。
每一层可以在不同的抽象层面上处理一个问题——靠近输入层的层面处理数据中比较低级的概念(例如图片的边缘之类),而越是到了深层网络,就处理越为抽象的概念。
深度学习不仅仅体现在“深度”
上,还能够享受神经元数量剧增的益处。
一个典型的1990年的神经网络可能只有大约100个神经元(如果你没忘的话,人类的大脑大约有1000亿个神经元)。
这样的网络在处理具体问题上显然十分具有局限性。
到了2016年,先进的神经网络已经拥有大约100万个神经元了(这个数量和蜜蜂的大脑大致相同)[68]。
最后,深度学习使用的深层次网络中,神经元本身的连接数量也十分可观。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!