在人类和机器正在进行的比拼中,机器又赢下一局:一个人工智能团队彼此协作,在视频游戏Dota 2的多玩家在线战斗竞技场(MOBA)中成功击败了五名半职业人类玩家。
Sam Altman
这个人工智能团队被称为OpenAI Five,它们由OpenAI开发,OpenAI是伊隆.马斯克和Y Combinator的总裁Sam Altman创立的人工智能研究实验室。
OpenAI的代理之前在一对一的比赛中击败了一些顶级人类玩家,但这是第一次由代理团队击败Dota 2排名超过99.95%玩家的人类玩家。团队模式更难,因为这种模式需要更多协作和长期规划。
OpenAI的联合创始人兼首席技术官Greg Brockman在推特上将这一天的游戏称为 “情感搭车”。他补充表示:“我们为OpenAI团队感到非常自豪,并且非常高兴在我们为国际(Dota 2锦标赛)做准备时继续改进这个系统。”
像Dota 2这样的游戏是挑战人工智能系统并测试其智能水平的最佳方式之一。像OpenAI Five这样的系统通过分析数千场之前比赛中的大量数据来学习如何玩这个游戏。
这项努力似乎没什么用处,但人工智能研究人员认为,他们最终能够用训练人工智能玩游戏的方法训练算法来解决某些复杂的现实世界问题。例如,像DeepMind这样的公司的科学家们已经在考虑如何利用人工智能来帮助缓解气候变化并检测癌症。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。