Facebook开源了人工智能软件另一个重要的组成部分,旨在帮助开发者在其软件应用中构建“强化学习模型”。
从今天开始,开发者可以使用Facebook的Horizon软件工具包来构建可以通过反复试验和试错以学习执行特定计算任务的应用。
Facebook此前一直使用Horizon来执行很多任务,包括训练其系统以预测用户最有可能对哪些通知做出响应。例如,Horizon帮助Facebook了解某个用户更有对于他母亲的点赞做出回应,而不是在同一个帖子上互动的其他几十个人。因此,就会突出显示“妈妈”之类的内容,以便让用户做出反应。
Horizon还用于支持Facebook Messenger应用中的虚拟助理M为用户提供个性化建议。
强化学习是AI的一个子集,涉及到使用模拟环境来训练计算机程序执行特定任务。例如,Facebook还使用强化学习来决定向用户传输高清还是非高清的视频,具体取决于蜂窝连接强度甚至是位置等因素。因此,如果特定用户在地铁上信号较弱时,它可能就会发送占用带宽较低的视频。
Facebook并不是唯一一家使用强化学习的公司。作为Facebook在人工智能领域的主要竞争对手之一,Google也在使用强化学习技术来训练计算机玩中国围棋游戏,而无需人工输入。Google的AlphaGo后来在五场系列比赛中击败了现围棋世界冠军李世石。
Facebook工程师Jason Gauci、Edoardo Conti和Kittipat Virochsiri在一篇博客文章中解释说,通过强化学习,计算机可以根据其行为的结果获得奖励或惩罚。因此,就Facebook向用户发送通知这件事来说,每当发送给用户的通知得到了响应的时候,工程师都给予系统奖励。
但是,当通知未能引起用户响应的时候,系统会受到惩罚。随着时间的推移,系统 来说都是一项艰巨的任务,Constellation Research首席分析师兼副总裁Holger Mueller这样表示。他认为,此举将有助于推动采用和获得更多的关注,不过仍然存在很多挑战,因为Horizon是运行在Facebook的PyTorch机器学习框架上,而该框架正在努力跟上谷歌更受欢迎的TensorFlow的发展步伐。
Mueller说:“而且由于该平台没有这些专用的、特有的硬件,所以也引发了有关实施成本和总体拥有成本的问题。企业必须快速构建应用,因此他们倾向于选择集成的产品。尽管如此,这仍然是一个很好的举措,Facebook可以从PyTorch平台中实现更多用途、价值和差异化。”
Facebook称,Horizon是首个公开可用的强化学习软件,目前用户已经可以通过GitHub进行下载。
好文章,需要你的鼓励
DDN推出Infinia对象存储系统,采用键值存储架构和Beta Epsilon树数据结构,实现读写性能平衡。系统在对象列表性能上比AWS快100倍,延迟降至毫秒级,支持多租户和SLA管理。通过与英伟达合作优化RAG管道,在AWS上实现22倍性能提升并降低60%成本。
大连理工大学和浙江大学研究团队提出MoR(Mixture of Reasoning)方法,通过将多种推理策略嵌入AI模型参数中,让AI能自主选择最适合的思考方式,无需人工设计专门提示词。该方法包含思维生成和数据集构建两阶段,实验显示MoR150模型性能显著提升,比基线模型提高2.2%-13.5%,为AI推理能力发展开辟新路径。
Alpine Linux核心开发者Ariadne Conill推出了Wayback项目,这是一个实验性的X兼容层,允许使用Wayland组件运行完整的X桌面环境。该项目本质上是一个提供足够Wayland功能来托管rootful Xwayland服务器的存根合成器。与现有的XWayland不同,Wayback旨在创建一个类似X11风格的基于Wayland的显示服务器,让用户能够继续使用传统的X11窗口管理器和桌面环境,而无需重写或替换这些熟悉的工具。
剑桥大学研究团队开发了FreNBRDF技术,通过引入频率修正机制显著提升了计算机材质建模的精度。该技术采用球面谐波分析提取材质频率信息,结合自动编码器架构实现高质量材质重建与编辑。实验表明,FreNBRDF在多项指标上超越现有方法,特别在频率一致性方面改善近30倍,为游戏开发、影视制作、电商预览等领域提供了重要技术支撑。