ZD至顶网软件频道消息:卡内基梅隆大学(CMU)的人工智能系统在匹兹堡20天的单挑扑克锦标赛上击败四名职业老手。该人工智能(AI)系统名为Libratus AI。Libratus AI具有策略推理功能,其计算能力可处理10的160次方的可能信息集合,该数目是单挑不限注德州扑克游戏具有的信息集合数。
Libratus由计算机科学教授Tuomas Sandholm和计算机科学博士生Noam Brown开发。Libratus在匹兹堡超级计算中心的桥牌计算机里运行。
据Sandholm和Brown称, Libratus的取胜并不是靠运气。Sandholm 表示,“ 顶级AI在不完整信息的情况下进行策略推理的能力已经超过了人类里的佼佼者。”
要击败Dong Kim、Jimmy Chou、Daniel McAulay和Jason Les四个专业牌手,Libratus必须在不知道其他牌的情况下作出决定,同时还要确定对手何时是在使诈。
卡内基梅隆大学表示,Libratus用了匹兹堡超级计算中心桥牌计算机846个计算节点的约600个计算节点的功力。该桥牌计算机的速度是每秒1.35 Petaflop,大约是高端笔记本电脑的7250倍,其内存为274 TB。
Sandholm表示,“每天赛事后,Libratus会用一种元算法分析其他专业牌手在Libratus策略里找到和利用过的漏洞。”
另外,Sandholm表示,“Libratus每天晚上然后会对漏洞按优先程度分级并利用超级计算机修补前三个漏洞,这种做法和以前在扑克游戏里用到的学习方法非常不一样。”
Sandholm称,“在研究人员开发的算法里,典型的做法通常是试图利用对手的弱点。与之相比,Libratus则是每天在算法上修补我们策略里的漏洞。”
据CMU计算机科学院计算机系主任Frank Pfenning介绍,Libratus可用于各种存在不完整信息的领域及对手有意散步非真实信息的领域,诸如商务谈判、军事策略、网络安全和医疗规划等领域都可以受益于自动决策。
Pfenning表示,“电脑若不会用虚张声势的策略就赢不了扑克游戏。开发一个会玩扑克游戏的人工智能系统在科学上是一个巨大的进步,可以在许多领域用得上。想象一下,有朝一日手里智能手机可以在买新车时砍价。当然还有许多别的用法。
“看看这场比赛,玩扑克的程序最终超越了人类最好的玩家,令人振奋。这些成就里的每一个都是我们对智能的理解的重要里程碑。”Pfenning表示。
而CMU在以前Watson和深蓝的开发过程中出过力。Watson是IBM的人工智能系统,曾在电视问答节目Jeopardy!里击败过人类对手。IBM的深蓝曾于1997年击败过国际象棋大师Garry Kasparov。
据悉,人工智能开发是卡耐基梅隆大学优先发展的重要项目。卡耐基梅隆大学称,去年11月获全球高盖茨律师事务所(K&L Gates LLP)1000万美元的捐助,用于建立一个主要研究人工智能伦理的新研究中心。
其时,卡耐基梅隆大学校长Subra Suresh表示,影响下一个世纪的不仅仅是技术。Suresh表示,“人类如何与科技互动、我们如何预测未来及如何应对由我们所做的导致的意想不到的后果、以及如何确保科技用于造福人类(在个人和社会的层面上),所有这些的都将对我们的未来产生重大影响。”
Suresh还表示,卡内基梅隆大学在人工智能、脑科学、网络安全、机器人技术方面在过去和现在都处于领导地位,可以说卡内基梅隆大学拥有探究上述各种话题的“独特地位”。
另据悉,上个月初,名为DeepStack人工智能系统的研究人员称,DeepStack算法是首个击败单挑不限注德州扑克游戏专业玩家的程序。
去年3月,谷歌子公司DeepMind旗下的AI AlphaGo在五场制人机围棋大战里击败九段棋士李世乭。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。