天才一秒记住【久久文学】地址:https://www.jjwxx.com
但这跟智能体开发的思路不一样,其实我们只是想让智能体代替我们执行最优的选择,它的选择跟人类是否一样,那就无关紧要了。
我们真正想要智能体做的是最正确的选择,至少尽可能做出最好的选择。
因此,人工智能开发的目标从构建做出跟人类一样选择的智能体转向做出最优选择的智能体。
智能体理论的出发点是用户的偏好。
如果你的智能体要代替你做事情,那么它需要明白你的希望是什么。
你当然想让智能体尽可能做出你喜欢的选择,那么,我们如何让智能体明白用户的偏好呢?假设,你的智能体要代替你在买苹果、橘子或者梨之间做出选择,它首先需要知道你对这三种不同结果的期望值。
例如,假设你的偏好如示例一这样的:
橘子比梨好
梨比苹果好
在这种情况下,你的智能体在苹果和橘子之间做出选择,它选了橘子,你会很高兴;如果它选择苹果,你就会失望。
这就是最简单的偏好示例,你的偏好关系描述了你如何对每一对备选结果进行排序。
冯·诺依曼和摩根斯坦的理性决策需要偏好关系满足某些一致性的基本要求。
例如,假设你的偏好是示例二这样的:
橘子比梨好
梨比苹果好
苹果比橘子好
这么看来你的喜好就有些奇怪了。
因为从橘子比梨好、梨比苹果好能推断出你在橘子和苹果中更喜欢橘子,但这就和你的声明相矛盾。
因此,你的偏好不满足一致性。
这就让你的智能体没办法为你做出最优决策。
下一步就是将符合一致性的偏好进行赋值,使用被称为实体程序的方式。
实体程序的基本思想是为每一种备选项赋予一个数字值:数字越大,就代表偏好程度越高。
例如,我们可以将橘子的偏好程度赋值为3,梨子为2,苹果为1,这样就可以描述前文第一个示例的情况了。
因为3大于2,2大于1,这样的话,实体程序就能够正确地捕捉到第一例中的偏好关系。
同样地,我们也可以用实体程序将橘子赋值为10,梨赋值为9,苹果赋值为0。
在这种情况下,这个赋值的具体数值并不重要:重要的是赋值大小引起的结果排序。
关键点在于,偏好设置必须满足一致性,才可以使用这种实体程序赋值的方式,用数值来表示偏好程度。
看看前文所举的第二个示例,试试你能不能给苹果、橘子和梨赋值来表示这个偏好关系。
用赋值关系来表示偏好程度的唯一目的是使其可以用数学计算的方式做出最优选择。
我们的智能体就可以选择偏好值最大的选择项,这就意味着它的选择可以达成我们最喜欢的结果。
类似这样的问题被称为优化问题,在数学中得到了广泛的研究。
我们举例来说明这个问题,下面的场景,你的智能体必须在两个选项中做出选择[55]:
选项1:掷一枚硬币,如果是正面,你的智能体获得4英镑;如果是背面,你的智能体获得3英镑。
选项2:掷一枚硬币,如果是正面,你的智能体获得6英镑;如果是背面,你的智能体什么都不获得。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!