柯洁对战AlphaGo,一场众人眼中人类必输的比赛意义何在?

胜负不是最终目的,柯洁对战AlphaGo,这场众人眼中人类必输的比赛可能产生更多深远的意义。

ZD至顶网软件频道消息:时隔一年,曾经被大众期待不已的、柯洁与AlphaGo的比赛终于有了眉目,双方相约今年五月在中国乌镇一决雌雄。不过这次,相对去年AlphaGo对战李世石的比赛,大众心中则是一边倒地认为,柯洁必输。


柯洁对战AlphaGo,一场众人眼中人类必输的比赛意义何在?
事实上,从去年AlphaGo对战韩国围棋九段选手李世石之后,AlphaGo的升级版本又以"Master"的名字与世界顶级的围棋选手进行了60场线上快棋赛,并最终大获全胜。AlphaGo成为历史上首个获得职业九段称号的非人类棋手,无败绩。同时,人们对于人工智能的认知也产生了天翻地覆的变化,认为围棋领域内人类与人工智能之争已经毫无悬念。

那么,柯洁对战AlphaGo,这场众人眼中必输的比赛又有什么意义?

柯洁:抱着必胜的决心
柯洁对AlphaGo的心路历程可以说是“跌宕起伏”。去年,AlphaGo对战韩国围棋九段选手李世石,柯洁几乎在李世石第一轮战败第一时间发微博称“就算阿法狗战胜了李世石,但它赢不了我”。那场比赛,AlphaGo 4:1轻松取胜李世石。

去年年底,柯洁在微博上透露:从三月份开始,研究了大半年的棋软,无数次的理论、实践,就是想知道计算机究竟强在哪里。人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。

今年四月初,在接受记者采访时,柯洁好几次用了“佩服”这两个字形容AlphaGo,他说AlphaGo用棋的妙处是以宏伟的构图或者大局观来压制棋手,虽然过程中会小失误,但是不影响大局。“AlphaGo超越了所有棋手的想象,像是真正来自未来的。”

从最早的不服气,到后来的理智分析、遭遇疑惑、衷心佩服,这大半年来,柯洁已经陆续与AlphaGo进行了多次练习。柯洁表示,“我很幸运地处在了这样一个历史变革的时代。作为一个棋手来讲,我能做的最大的努力就是下好自己的棋,绝不会轻易妥协,我不会说输了也无所谓这样的话,因为这不是我,无论他有多强大,我都要和它一决胜负,我要抱着必胜的心态还有必死的信念,不会轻易言败。”

“不公平的比赛”
围棋被认为是世界上最复杂的棋盘游戏,在这项流传了千年的棋盘上,人类曾在围棋着法上形成了长久以来的固定定式,这些定式就像武林高手过招,虽凶险却有迹可循。说白了,所谓技高一筹就是要看哪位棋手算的更快更准确。

围棋使用方形格状棋盘及黑白二色圆形棋子进行对弈,棋盘上有纵横各19条直线将棋盘分成361个交叉点,棋子走在交叉点上,双方交替行棋,落子后不能移动,以围地多者为胜。中国古代围棋是黑白双方在对角星位处各摆放两子(对角星布局),是为座子制,由白棋先行。现代围棋由日本发展而来,取消了座子规则,黑先白后,使围棋的变化更加复杂多变。对人工智能而言,围棋的挑战性不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

为了应对围棋的巨大复杂性,AlphaGo 采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

柯洁对战AlphaGo,一场众人眼中人类必输的比赛意义何在?

在获取棋局信息后,AlphaGo 会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

柯洁对战AlphaGo,一场众人眼中人类必输的比赛意义何在?
微软亚洲研究院首席研究员刘铁岩曾评价AlphaGo对战李世石的比赛为“不公平的比赛”,他认为,人类大脑的优势显然不是计算,而AlphaGo代表的庞大的计算机在计算方面的优势则远远高于人类,加上AlphaGo本身就是多位著名的技术专家共同协作制造的,从这个角度看,棋手以一人之力对抗多位技术专家和庞大的计算集群,胜算可想而知。

胜负不是最终目的
柯洁对战AlphaGo,结局并不乐观,但是各方对于比赛的重视显然也不仅仅在于胜负。

国家体育总局棋牌运动管理中心主任罗超毅表示:“胜负固然重要,但是胜负不是我们这次活动的全部,甚至从一定程度上讲,胜负已经不是这个活动的主题了。当我知道柯洁和我们其他几位棋手要跟阿尔法狗进行对决的时候,我感觉到,这是一批科学家跟我们的围棋高手进行一次智慧的交流。从计算上来讲,计算机早就已经赢了人类,这次对决本质上是探索围棋奥秘,是深度学习本身带给人类的重要启发。”

5 月 23 日至 27 日,在乌镇举办“中国乌镇·围棋峰会”设计了三种比赛形式,包括:
* 柯洁对阵 AlphaGo:双方进行三番棋对弈,无论输赢双方必须下满三局,每方将有3小时时间,用时结束后将有5次1分钟读秒。
* 人机配对赛:2位中国职业棋手分别与 AlphaGo 组队,每方一小时,用时结束后将有1次1分钟读秒。
* 团队赛:五位中国顶尖棋手组队与 AlphaGo 进行对弈,每方2.5小时,用时结束后有3次1分钟读秒。共同测试 AlphaGo 在面对组合风格时所展现的创造力和适应性。

三种比赛形式不仅要考验 AlphaGo对不同组队方式下比赛的创新能力,同时也要看人类和 AlphaGo的合作能够产生哪些火花。谷歌大中华区总监石博盟表示:“战胜柯洁对于AlphaGo来说也不是容易的事情,我们还在探索新的打法。”

但无论如何,Deepmind创造出AlphaGo的目的并不是取代人类,或者获得更好地战绩,AlphaGo的存在是帮助人类如何在信息不完美的情况下做出最好的选择。目前,AlphaGo 背后的部分机器学习方法已经被应用到实际生活中,并在一些重大问题中发挥了作用,比如减少能源使用。机器学习技术也已经开始应用于一系列令人振奋的医疗研究项目中。同时,在 Goolge 的众多产品中,我们也能看到机器学习正在将许多的“不可能”变成现实:它使得人们可以利用 Google Photos 立即找到爱犬在雪地里的照片,也令 Google 翻译获得了比过去10年中取得的所有进步都更为显著的提升。

来源:ZD至顶网软件频道

0赞

好文章,需要你的鼓励

2017

04/11

21:16

分享

点赞

邮件订阅
白皮书