ZD至顶网软件频道消息: 被称为DeepStack的、会玩扑克的人工智能系统,其背后研究人员表示,这是第一个在单挑无限模式下战胜人类职业扑克玩家的算法。这个说法如果属实,将标志着人工智能系统发展的一个重要里程碑。
击败人类职业扑克玩家不同于人工智能过去在智力竞赛节目Jeopardy或者围棋等游戏中战胜人类对手的成功,因为每个玩家都只能掌握游戏状态不完整的一部分,并需要一个导航战术程序,例如基于不对称的信息虚张声势。
DeepStack是University of Alberta和两所捷克大学的研究人员合作的成果,他们在一份新的非同行评审的论文中表示,这是“第一个在单挑无限模式下战胜人类职业扑克玩家的计算机程序。”
新的一页已经展开,卡内基梅隆大学竞技性人工智能扑克团队的研究人员宣布将进行一场由他们的系统和四位职业人类扑克玩家——Jason Les、Dong Kim、Daniel McAulay和Jimmy Chou的对抗赛,这四个人类职业玩家加在一起将在20天内和Libratus玩120,000手单挑无限德州扑克。
Libratus是卡内基梅隆大学开发的Claudico的继任者,它在2015年和同样四位玩家对抗,在超过8万手牌后失利。微软研究院为这场比赛捐赠了10万美元的奖池。
虽然Claudico和DeepStack使用一种称为“反事实遗憾最小化”的技术通过卡片游戏策略进行推理,但DeepStack的制造商说,它的系统“采用了一种完全不同的方法”来处理信息不对称,包括在决定保留哪张牌的时候模拟“直觉”。
Libratus和DeepStack都被描述为使用新奇的方法来实现纳什均衡,卡内基梅隆大学将其定义为“一对战略,每个玩家,只要一个玩家的策略保持不变,就不会有玩家因为改变战略受益。”
DeepStack的研究人员写道,“DeepStack算法试图在这个游戏中计算和使用游戏的低利用率策略,即求解一个近似的Nash均衡。只有在游戏中实际出现的公共树的状态时,DeepStack在游戏过程中计算这个策略。本地计算的能力限制了DeepStack在游戏中推理能力,如果不将游戏中的10项权力抽象的160个决策点减少为14项权力,计算的量对于现有的算法来说就太大了。”
DeepStack接受了来自国际扑克联盟(International Federation of Poker)的33名职业扑克玩家的评估。每个参与者被要求在一个月内参加3000场比赛。
DeepStack研究人员写道,“33位职业玩家总共参加了44,852场比赛,11位玩家完成了所要求的3000场比赛。在所有的比赛中,DeepStack赢得了492 mbb / g(每场比赛的超大盲注)。从零开始有四个标准背离,因此非常引人注目。”
卡内基梅隆大学表示,Libratus采用更快的方法来找到纳什均衡,以及开发更好的终结策略,这是由匹兹堡超级计算中心的Bridges超级计算机支撑实现的。
Sandholm表示,“我们正在疯狂推动超级计算机。”Sandholm表示,Libratus使用了1500万个核心小时的计算,而Claudico只有300万个。
卡内基梅隆大学的比赛今天上午11点在Pittsburgh Rivers Casino开始,将在晚上7点左右结束。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。