ZD至顶网软件频道消息:时隔一年,曾经被大众期待不已的、柯洁与AlphaGo的比赛终于有了眉目,双方相约今年五月在中国乌镇一决雌雄。不过这次,相对去年AlphaGo对战李世石的比赛,大众心中则是一边倒地认为,柯洁必输。
事实上,从去年AlphaGo对战韩国围棋九段选手李世石之后,AlphaGo的升级版本又以"Master"的名字与世界顶级的围棋选手进行了60场线上快棋赛,并最终大获全胜。AlphaGo成为历史上首个获得职业九段称号的非人类棋手,无败绩。同时,人们对于人工智能的认知也产生了天翻地覆的变化,认为围棋领域内人类与人工智能之争已经毫无悬念。
那么,柯洁对战AlphaGo,这场众人眼中必输的比赛又有什么意义?
柯洁:抱着必胜的决心
柯洁对AlphaGo的心路历程可以说是“跌宕起伏”。去年,AlphaGo对战韩国围棋九段选手李世石,柯洁几乎在李世石第一轮战败第一时间发微博称“就算阿法狗战胜了李世石,但它赢不了我”。那场比赛,AlphaGo 4:1轻松取胜李世石。
去年年底,柯洁在微博上透露:从三月份开始,研究了大半年的棋软,无数次的理论、实践,就是想知道计算机究竟强在哪里。人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。
今年四月初,在接受记者采访时,柯洁好几次用了“佩服”这两个字形容AlphaGo,他说AlphaGo用棋的妙处是以宏伟的构图或者大局观来压制棋手,虽然过程中会小失误,但是不影响大局。“AlphaGo超越了所有棋手的想象,像是真正来自未来的。”
从最早的不服气,到后来的理智分析、遭遇疑惑、衷心佩服,这大半年来,柯洁已经陆续与AlphaGo进行了多次练习。柯洁表示,“我很幸运地处在了这样一个历史变革的时代。作为一个棋手来讲,我能做的最大的努力就是下好自己的棋,绝不会轻易妥协,我不会说输了也无所谓这样的话,因为这不是我,无论他有多强大,我都要和它一决胜负,我要抱着必胜的心态还有必死的信念,不会轻易言败。”
“不公平的比赛”
围棋被认为是世界上最复杂的棋盘游戏,在这项流传了千年的棋盘上,人类曾在围棋着法上形成了长久以来的固定定式,这些定式就像武林高手过招,虽凶险却有迹可循。说白了,所谓技高一筹就是要看哪位棋手算的更快更准确。
围棋使用方形格状棋盘及黑白二色圆形棋子进行对弈,棋盘上有纵横各19条直线将棋盘分成361个交叉点,棋子走在交叉点上,双方交替行棋,落子后不能移动,以围地多者为胜。中国古代围棋是黑白双方在对角星位处各摆放两子(对角星布局),是为座子制,由白棋先行。现代围棋由日本发展而来,取消了座子规则,黑先白后,使围棋的变化更加复杂多变。对人工智能而言,围棋的挑战性不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。
为了应对围棋的巨大复杂性,AlphaGo 采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。
在获取棋局信息后,AlphaGo 会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。
微软亚洲研究院首席研究员刘铁岩曾评价AlphaGo对战李世石的比赛为“不公平的比赛”,他认为,人类大脑的优势显然不是计算,而AlphaGo代表的庞大的计算机在计算方面的优势则远远高于人类,加上AlphaGo本身就是多位著名的技术专家共同协作制造的,从这个角度看,棋手以一人之力对抗多位技术专家和庞大的计算集群,胜算可想而知。
胜负不是最终目的
柯洁对战AlphaGo,结局并不乐观,但是各方对于比赛的重视显然也不仅仅在于胜负。
国家体育总局棋牌运动管理中心主任罗超毅表示:“胜负固然重要,但是胜负不是我们这次活动的全部,甚至从一定程度上讲,胜负已经不是这个活动的主题了。当我知道柯洁和我们其他几位棋手要跟阿尔法狗进行对决的时候,我感觉到,这是一批科学家跟我们的围棋高手进行一次智慧的交流。从计算上来讲,计算机早就已经赢了人类,这次对决本质上是探索围棋奥秘,是深度学习本身带给人类的重要启发。”
5 月 23 日至 27 日,在乌镇举办“中国乌镇·围棋峰会”设计了三种比赛形式,包括:
* 柯洁对阵 AlphaGo:双方进行三番棋对弈,无论输赢双方必须下满三局,每方将有3小时时间,用时结束后将有5次1分钟读秒。
* 人机配对赛:2位中国职业棋手分别与 AlphaGo 组队,每方一小时,用时结束后将有1次1分钟读秒。
* 团队赛:五位中国顶尖棋手组队与 AlphaGo 进行对弈,每方2.5小时,用时结束后有3次1分钟读秒。共同测试 AlphaGo 在面对组合风格时所展现的创造力和适应性。
三种比赛形式不仅要考验 AlphaGo对不同组队方式下比赛的创新能力,同时也要看人类和 AlphaGo的合作能够产生哪些火花。谷歌大中华区总监石博盟表示:“战胜柯洁对于AlphaGo来说也不是容易的事情,我们还在探索新的打法。”
但无论如何,Deepmind创造出AlphaGo的目的并不是取代人类,或者获得更好地战绩,AlphaGo的存在是帮助人类如何在信息不完美的情况下做出最好的选择。目前,AlphaGo 背后的部分机器学习方法已经被应用到实际生活中,并在一些重大问题中发挥了作用,比如减少能源使用。机器学习技术也已经开始应用于一系列令人振奋的医疗研究项目中。同时,在 Goolge 的众多产品中,我们也能看到机器学习正在将许多的“不可能”变成现实:它使得人们可以利用 Google Photos 立即找到爱犬在雪地里的照片,也令 Google 翻译获得了比过去10年中取得的所有进步都更为显著的提升。
好文章,需要你的鼓励
法国AI初创公司Mistral AI发布了首个大语言模型全面生命周期评估,量化了AI的环境代价。其Mistral Large 2模型训练产生20,400吨二氧化碳当量,消耗281,000立方米水。运营阶段占环境影响85%,远超硬件制造成本。研究表明地理位置和模型大小显著影响碳足迹,企业可通过选择适当规模模型、批处理技术和清洁能源部署来减少环境影响。这一透明度为企业AI采购决策提供了新的评估标准。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。