天才一秒记住【久久文学】地址:https://www.jjwxx.com
这种情况下,你的智能体应该选择1还是2?我认为选项1是更好的选择,但是,为什么呢?
为了理解原因,我们需要一个叫作预期效用的概念,此处的预期效用可以等价于在此选择下获得的平均收益。
所以,考虑到选项1。
我们掷硬币的概率是对半的(不考虑正面和反面的细微重量差别),所以我们预期正面和反面出现的次数平均下来应该是相等,即一半正面,一半反面。
所以,你的智能体一半的时间会收到4英镑,一半的时间会收到3英镑。
因此,你的智能体从选择1当中获得的预期效用是(0.5×4)+(0.5×3)=3.5(英镑)。
当然,从实际上来说,你的智能体选择1的时候不可能得到3.5英镑的收益,只是如果选择的次数足够多,获得收益的平均值就是3.5英镑。
同样的道理,我们能计算出选择2的预期效用是(0.5×6)+(0.5×0)=3(英镑),所以平均来说,选择2只能给你带来3英镑的预期效用。
冯·诺依曼和摩根斯坦的理论中,理性决策的基本原则就是会做出预期效用最大化的行为。
在这种情况下,预期效用最大化的选择是选项1,因为它的预期效用为3.5英镑,大于选项2中3英镑的预期效用。
请注意,选项2中提供了诱人的获得6英镑的可能性,这比方案1中的任何结果收益都高,但是,将这个诱人的可能性与同样可能获得0收益的概率相权衡,就不难明白为什么选项1的预期效用比较高了。
预期效用最大化的想法经常被人们误解,有些人认为用数字计算人类的偏好和选择是一种令人厌恶的行为。
这种厌恶通常来自一个错误的概念,即收益就等于金钱,或者预期效用最大化理论从某种意义上来说是自私的(因为假设一个使预期效用最大化的智能体行为是只考虑到自己的收益)。
但收益这个东西不过是获取偏好数值的一个定义而已,冯·诺依曼和摩根斯坦的理论在对于个人偏好究竟是什么或者应该是什么这个问题上完全保持中立,这个理论同样也适用于天使和魔鬼的偏好。
如果你是一心为别人牺牲的人,那也没关系,如果你的利他主义偏好被赋值表达,那么预期效用最大化理论同样适用于你,就如它也适用于世界上最自私的人那样。
应对不确定性
人工智能还有一个长期存在的问题——如何处理不确定性,在20世纪90年代这个问题变得尤为重要。
任何一个现实的人工智能系统都必须处理好不确定性问题,有时甚至会处理许多。
举个例子,无人驾驶汽车从传感器获取数据流,但传感器并非完美的,例如测距仪说“前方没有障碍物”
,这个结论不能保证百分百准确。
测距仪掌握的信息当然有重要价值,但是我们不能百分百信任它。
那么,考虑到会出错的可能性,我们又该怎么利用它呢?
在人工智能的历史上,出现过许许多多应对不确定性方案的特别发明或者再发明,但到了90年代,一种特定的方法占据了主导地位,这种方法被称为贝叶斯推断。
贝叶斯推断是由18世纪英国神学家、数学家托马斯·贝叶斯(ThomasBayes)发明的,使用了同样由贝叶斯提出的贝叶斯定理。
贝叶斯定理关注的是在新的信息面前,我们应该怎么理性地去调整既有认知。
在无人驾驶汽车的案例中,认知与我们前面是否有障碍物相关,而新的信息就是传感器传来的数据。
另外,贝叶斯定理很有趣,因为它强调了人们在处理涉及不确定性的认知决策时有多么糟糕。
为了更好地理解这一点,请考虑如下场景:
一种新的致命的流感病毒开始流行,感染概率为千分之一。
人们研究出了一种新的流感检验方法,准确率为99%。
你突发奇想去参加检测,结果呈阳性。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!