Facebook开源了人工智能软件另一个重要的组成部分,旨在帮助开发者在其软件应用中构建“强化学习模型”。
从今天开始,开发者可以使用Facebook的Horizon软件工具包来构建可以通过反复试验和试错以学习执行特定计算任务的应用。
Facebook此前一直使用Horizon来执行很多任务,包括训练其系统以预测用户最有可能对哪些通知做出响应。例如,Horizon帮助Facebook了解某个用户更有对于他母亲的点赞做出回应,而不是在同一个帖子上互动的其他几十个人。因此,就会突出显示“妈妈”之类的内容,以便让用户做出反应。
Horizon还用于支持Facebook Messenger应用中的虚拟助理M为用户提供个性化建议。
强化学习是AI的一个子集,涉及到使用模拟环境来训练计算机程序执行特定任务。例如,Facebook还使用强化学习来决定向用户传输高清还是非高清的视频,具体取决于蜂窝连接强度甚至是位置等因素。因此,如果特定用户在地铁上信号较弱时,它可能就会发送占用带宽较低的视频。
Facebook并不是唯一一家使用强化学习的公司。作为Facebook在人工智能领域的主要竞争对手之一,Google也在使用强化学习技术来训练计算机玩中国围棋游戏,而无需人工输入。Google的AlphaGo后来在五场系列比赛中击败了现围棋世界冠军李世石。
Facebook工程师Jason Gauci、Edoardo Conti和Kittipat Virochsiri在一篇博客文章中解释说,通过强化学习,计算机可以根据其行为的结果获得奖励或惩罚。因此,就Facebook向用户发送通知这件事来说,每当发送给用户的通知得到了响应的时候,工程师都给予系统奖励。
但是,当通知未能引起用户响应的时候,系统会受到惩罚。随着时间的推移,系统 来说都是一项艰巨的任务,Constellation Research首席分析师兼副总裁Holger Mueller这样表示。他认为,此举将有助于推动采用和获得更多的关注,不过仍然存在很多挑战,因为Horizon是运行在Facebook的PyTorch机器学习框架上,而该框架正在努力跟上谷歌更受欢迎的TensorFlow的发展步伐。
Mueller说:“而且由于该平台没有这些专用的、特有的硬件,所以也引发了有关实施成本和总体拥有成本的问题。企业必须快速构建应用,因此他们倾向于选择集成的产品。尽管如此,这仍然是一个很好的举措,Facebook可以从PyTorch平台中实现更多用途、价值和差异化。”
Facebook称,Horizon是首个公开可用的强化学习软件,目前用户已经可以通过GitHub进行下载。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
微软研究院推出rStar-Math系统,通过创新的"深度思考"训练方法,让小型AI模型在数学推理能力上达到甚至超越OpenAI o1水平。该系统采用代码验证、过程偏好模型和四轮自进化训练,将70亿参数模型的数学能力从58.8%提升至90.0%,在美国数学奥林匹克竞赛中达到前20%水平,证明了精巧方法比模型规模更重要,为AI发展开辟了新路径。