阿法狗赢了 但人工智能依然是送给世界的礼物

时间:2022-09-09        

  相比之前的四局,第五局显得波澜不惊。无论是演播室里的棋手,还是讨论技术的专家,抑或屏幕前的观众都能以愉悦的心情观赏比赛。

  李世石九段在取得开局优势后,显得过于保守。虽然双方各有失误,但AlphaGo似乎有着更好的大局观,终以微弱优势胜出。赛后的新闻发布会上,李九段说自己感到遗憾,希望以后能给观众呈现更强的自己。事实上,他已经通过棋局,给世界呈现了超越胜负的意义(所谓伟大的棋手,即使是失败,也能留给世界一些超越胜负的“遗产”)。比如,比赛剩余的奖金被捐赠给联合国儿童基金会(UNICEF),STEM教育机构,以及围棋慈善机构。

  正如比赛解说迈克雷蒙(九段)所言,AlphaGo团队和李世石为围棋界,乃至全世界送来了礼物。这场全新的围棋比赛,不仅让爱好围棋的人们聚集到一起,而且让全世界的人来关注这项运动,跨越障碍,彼此分享交流。

  颁奖典礼上,韩国棋院的总裁朴治文也提到,他一开始惊讶于人工智能的表现,但在思考之后,他相信在未来人类社会中,人工智能可以为社会做出许多贡献。事实也证明,由于这场比赛,欧洲和美国以及全世界有更多人的喜欢上了围棋,围棋也可以成为一项全球化的活动。东西方棋手之间的对决也会随之到来。

  不仅仅是西方人开始通过围棋感受到东方文化的精髓,这项高水平的智力运动通过人工智能的解读,也从此有了新的发现。“青少年可以有更好的围棋训练变得优秀,而国家也会随之成为优秀的国家”。

  上海纽约大学终身教授,纽约大学库朗数学研究所兼职教授、CILVR实验室成员,前微软亚洲研究院副院长。

  在战前,我做过这么一个含金量为零的预测:AlphaGo必胜,只是不见得是这一次。随后的一周,惊心动魄,也不断被打脸。

  随着战局的进展,各类科普文章不停涌现,其中不乏佳作。我来稍稍总结一下。“狗狗”是如何炼成的:先偷看3千万棋谱,站在巨人肩膀,然后左右手互博涨棋力。“狗狗”下棋是一杯混杂的鸡尾酒:花相对高的代价逐个敲开搜索图谱,然后几十条“狗狗”夺门而出,以胜率判断为指南针,用蛮力一击到底,闪电般地来回踩踏再凝聚一点——啪,落子。既复杂,也不复杂,它把工程和数学的结合达到了艺术品的高度;把高度的计算量压缩到可以和人对局(甚至用时更少)。至少对我来说,它在尺度上的大腾挪不比引力波事件差。

  然而它还是败了一局。有个朋友笑说,这充分说明了狗咬人不是新闻,人咬狗才是。AlphaGo应对不正确的胜率估算严重滞后,休克期间昏招连连。很可能是胜率估算出了问题,导致“狗狗”们集体跑错方向;但终极原因,还是因为站在不那么高的肩膀上。DeepMind的团队说要清零,把棋谱扔掉,正本清源,重头开始。这是昏招,更是伟业,希望他们成功!

  自觉打脸最重的是,之前我对在棋局之外的人机交谈本不报任何希望。但现在,我相信,“狗狗”和人类都互相学习了很多很多——棋界,学界,媒体,普罗大众。表现最为出色的是棋界,不止李世石一人。以胜负说话,以棋艺为上,黑白之秤牢牢搞定方位,简单,直接。至于学界和业界,我觉得应该先认清自己的站位:0 - 。为什么是“零减”?先留个伏笔,以后再慢慢道来。

  香港科技公司首席架构师、香港大学计算机博士、围棋业余5段(弈城9段),前微软及谷歌(微博)软件工程师,iOS软件“围棋之眼”作者

  第四盘比赛结束的时候,让人类好像经历外星人入侵,把人类英雄踩在脚下,然后血泊中的英雄,瞬间崩发出神之一手,反戈一击成功。好莱坞的典型煽情故事。一瞬间,职业棋手都缓过来了,纷纷发贺电鄙视阿法哥。

  但今天我想用轻松的心情细细品味最终一战,立场是支持围棋棋道,不论胜负,给双方选手都加油。

  李世石今天心态很放松,可以从开始的时间控制看出来,李世石的布局也相当简明。到了40,黑棋空多无弱子。

  黑棋左边31的靠,记得是吴清源大师提倡过的简明手段。大道至简,也许这是围棋的最高境界。

  阿法哥右下就让人鄙视了。业余棋手都能看清的手段,硬是自己下死,花了代价学会了“大头鬼”这个围棋手段。我预感,如果阿法哥输了,它会受到各方职业棋手的鄙视。“发力点根本不对啦,根本不会下棋”。

  70手是阿法哥卓越的中腹感觉,黑棋下得有点保守,最后三目活。应该是心理出现波动,想赢怕输。解说的麦克雷蒙这时冒出一句话:李世石估计在想,前三盘是怎么会输给那么low的阿法哥啊。此时,局面已经很细微了,甚至白棋潜力巨大。

  阿法哥下到第100手,第三局的大师风采又来了。黑棋得拼搏了。但是中间弱棋还没治理,只能挥师左下。还好,阿法哥慈悲,放黑棋从二路爬回。转而亮出136手的小阿飞刀。

  还有一个看点,就是阿法哥今天也进入读秒,但是发型没乱。最终,如果要点目,是白胜2.5目,即1又1/4子。

  整盘棋,李世石开局顺利,但是没有绷紧,下得过于放松。看来,人都是逼出来的。生于忧患 ,死于安乐。

  顺便总结下五盘棋。这五盘,基本上我都第一时间观看。第一盘,李世石惜败,本来有机会。第二盘,阿法哥下出很多好手,五路尖冲,还有中后盘碾压式的计算能力,该它赢。第三盘,阿法哥玄妙莫测的棋风,酷似吴清源,前半盘50手就已经把李世石击倒。但是后面有瑕疵,暴露了局部计算不能找到正解的弱点。第四盘,李世石心态好,布局策略正确,打散稳住,但中盘冒进转换后落后,之后中腹在极度困难的情况下发出神之一手,阿法哥应对失误,被人类KO。也是第一次看到阿法哥认输的样子。第五局,布局李世石简明领先,布局策略对头。中腹战斗患得患失,最终失利。

  这一次比赛,无论胜负,都是棋道的胜利。吴清源说过他200岁之后要在宇宙中下棋。冥冥之中,我觉得他真的来了。借此,致敬吴清源棋圣。

  这五盘棋进行的时间是我不断学习提高的过程,新事物的强烈冲击果然是人学习的重要动力来源。

  前四盘讲完以后还有很多人问,棋牌上人工智能赢了不是很正常么,为什么要和举重机比力气和计算器比算数和人工智能比数据分析呢?

  因为现在的计算机其实和人类一样,并没有办法穷尽围棋里复杂的变化。人学围棋的方法是大量的积累棋谱库和锻炼计算力,比赛的时候根据经验计算,在一定情绪氛围内,用逻辑进行判断之后做出决策。AlphaGo是什么样呢,他的本质是大量的随机落子,总结哪些胜率高,然后把局部特征总结出来备用最后与估值网络的判断结合分别评分之后落子。

  本次比赛的看点之一是依靠胜率分析而没有逻辑判断的系统,和人的逻辑判断为主的系统优劣如何。

  五局比赛对于李九段来说,压力显然非比寻常。作为人类一方的代表,被关注的程度和比赛的意义或许超过了任何一次世界大赛。且不说激烈的关注程度,还有摄像头无时无刻的追踪拍摄,在这种情况下李世石九段顽强拼搏的斗志相信会被广大棋迷铭记。

  这次比赛完以后,很多棋手表示看到了围棋更迷人的地方。而在围棋技术上,AlphaGo带来了更为广阔清晰地思路,提供了更好的训练方法和判断参考。相信Google在围棋上的探索只是小小一方面,这次比赛给人工智能赚足了眼球,期待Google之后的大招。

  下面重点讲讲棋局,感觉这盘棋李九段已经基本回到正常状态,最后一盘已经很放得开,十分精彩。AlphaGo经营全局的水平很高,像是打太极,从不起杀心,非常均衡。其看点在于控制与均衡。

  之前的开局,Alphago喜欢使用一些古老的套路和自创的招法,这盘棋难得的使用了比较新的流行变化。第一次看到,觉得AlphaGo很有活力。

  进行到这里是第一个分歧,如果“退”是平稳的下法,如果“点”或者“夹“击则进入战斗。

  这里李九段稍作犹豫,马上点入,这里是其典型风格。进行到下图,黑棋右下实地很大,稍可满意。

  AlphaGo这步棋,利用右下气紧,李九段反其道而行之,冲一个,非常有意思。实战的结果来看,局部李九段获利很大,这种局部计算AlphaGo还是有问题。不过从之后的运转来看,损失却有限。

  初学的棋友要注意了,实战AlphaGo被迫给大家演示了一下:被著名手筋大头鬼吃掉是什么样子。

  最近几盘AlphaGo总会走肩冲,李九段使出斗转星移,以彼之道还施彼身。可惜被白棋反镇一个,这局部最后落了下风。

  进行到这里,黑棋上面只活了三目,所得甚少,相比之下右上白棋模样有近五十目的潜力,白花花一片,这种控制全局的能力,还是AlphaGo强大。

  托很有争议,局后很多意见仍然倾向于走简单的点三三。实战结果一二路混合爬过,影响到了中央的厚薄,感觉并不好。

  收官时最后的转换,按照陈耀烨九段的说法,最后结果可能黑棋稍亏。之后黑棋官子稍有所得,但是微细的差距中AlphaGo最后没有给李九段机会。

  这一盘双方都出错了,相比之下,AlphaGo明显的错误反而更多一些,很多时候我们都是这样,赢了开心庆祝,总结胜招;输了反躬自省,各种不对。对人的成长来说,胜利的甜头固然重要,不过在大的趋势面前,用长远的视角去分析去看自己该站的位置更为重要。即使这次李世石九段赢了,总有一天我们会败在不断完善的算法上,对于围棋界来说这一天可能来的比预想的早太多太多,但对于国际象棋等等棋类,十年前就在思考这样的问题了。

  胜固欣然,败亦可喜。有些思考的价值始终超越于胜负之上,超越于变化本身,神经网络几十年前就有,到如今才初得大成。很多人喜欢簇拥在鲜花簇拥,富丽堂皇的场所之中追随潮流和一个又一个热点。越是这样飞速发展,不断变化的时代,越需要宁静致远,清晰冷静的大局观,不论是在棋盘上还是在人生中。

  “科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。