天才一秒记住【久久文学】地址:https://www.jjwxx.com
这场比赛中,AlphaGo以4∶1的成绩击败了李世石:李世石输掉了前三局,在第四局中扳回一城,但输掉了第五局。
大家都说,李世石一开场就输了。
他很惊讶——本来他以为会轻松取得胜利。
而且不止一个人开玩笑说,AlphaGo故意输掉第四局,多少给李世石留点面子。
在比赛的很多节点上,人类评论员指出AlphaGo的举动奇怪。
很明显,这种落子“不是人类会做的选择”
。
当然,当试图分析AlphaGo如何下棋的时候,我们是从一个非常人性化的角度来分析的,我们本能地寻找下围棋时人类的动机和策略——我们将AlphaGo人性化了。
试图用这种方式理解AlphaGo是没有意义的:它只是一个程序,它的存在只为了一个目的——赢得围棋比赛。
我们想把动机、推理和策略归因于程序,但无法做到,AlphaGo的卓越能力是通过其神经网络的权重来体现的。
这些神经网络不过是一串很长的数字列表,我们无法提取或合理化它们所包含的专业知识。
AlphaGo也无法告诉我们它如此落子的原因,而这正是深度学习需要解决的关键问题之一。
AlphaGo被吹捧为深度学习和大数据型人工智能的胜利,从事实来看,它倒也实至名归。
不过撇开表象深入挖掘,你会发现AlphaGo中最能体现智慧的工程都源自经典的人工智能搜索。
我们在第二章提到的于20世纪50年代开发了跳棋学习程序的亚瑟·塞缪尔,他在理解AlphaGo使用的搜索技术时不会有任何困难:从他的跳棋程序,到现代最引人注目的人工智能系统,都遵循着同一条发展路径。
两个里程碑式的成就,对大多数人而言应该已经足够了。
但是,仅仅18个月后,深度思维再次出现在头条新闻中。
这次是一个比AlphaGo更厉害的人工智能,被称为AlphaGoZero。
它的非凡之处在于它是从零开始学习下围棋的,没有学习任何人类棋手的棋谱。
在没有人工数据干预的情况下,它达到了超越人类棋手的水平,而这一切,只是通过它自己和自己下围棋来实现的[77]。
公平地说,它必须自己下过很多次才能达到超人的水准,但不管怎么说,这都是一个惊人的成就。
它的后续版本名叫AlphaZero,进一步推广到玩包括国际象棋的其他棋类游戏。
在结束9个小时的自我学习以后,AlphaZero能够在和鳕鱼系统[12]对战中连续击败对方,最少也能保持平局——鳕鱼系统是世界领先的国际象棋程序之一。
来自国际象棋编程领域的退役专家纷纷表示他们极其惊讶。
AlphaZero自己和自己下了9个小时国际象棋,就能够自学成为世界级的国际象棋手?这种想法简直令人难以置信。
而真正令人兴奋的是这种方法的普适性:AlphaGo尽管在围棋方面表现优秀,但它只能下围棋,还必须事先学习许多人类专业棋手的棋谱。
而AlphaZero似乎可以自学成才,并且适用于多种不同类型的棋类游戏。
当然,我们得谨慎地下结论,不能过度解读。
首先,尽管AlphaZero体现了令人印象深刻的通用性(它在棋类游戏专业的通用性方面超过了此前任何一个人工智能系统),但它本身并不代表迈向通用人工智能的重大进步。
它甚至没有我们人类所普遍拥有的智能,在下棋方面它很专业,但它不能跟人交流,不能讲笑话,也不会煎鸡蛋、骑自行车或者系鞋带。
它的卓越能力其实有着相当的局限性。
当然,棋类游戏是相当抽象的——它们与现实世界相去甚远,正如罗德尼·布鲁克斯很快将要提醒我们的那样。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!