Spotify 星期三宣布了其应用程序的一次更新,该更新旨在让用户更加自主地掌控自己的听歌体验和推荐内容。这次焕然一新的体验引入了一系列新功能,这些功能将逐步推送给所有 Spotify 用户以及 Premium 订阅者,包括帮助用户管理播放队列、当前播放体验、辅助创建播放列表等。
这些改动有助于平衡此前应用程序过于依赖算法推荐来建议和播放音乐的现状,改为赋予用户决定播放内容、播放时间以及播放频率的权力。
对于 Premium 用户,Spotify 对播放队列进行了全新设计。公司表示,全新设计提供了更便捷的访问方式,使用户可以轻松控制 Shuffle、Smart Shuffle、Repeat 和 Sleep Timer 等功能。如果需要,用户还可以在 Spotify 的设置中将 Smart Shuffle 和 Autoplay 完全关闭。
此外,Premium 订阅者将开始看到 Spotify 在其排队曲目之后推荐播放的曲目,这样用户可以预先选择哪些曲目保留在播放队列中。
在听音乐的过程中,Spotify 声称,当你在播放列表中遇到不想听的曲目时,可以点击一个全新设计的 Hide 按钮,该按钮位置更加直观。该按钮将隐藏所有设备中播放列表里的该曲目。不过,公司很快将推出一个更强大的“隐藏”功能 —— 新推出的 30 天 Snooze 功能,该功能会暂时将某个曲目从推荐列表中移除。
公司还推出了改进移动端播放列表管理的功能。在播放列表顶部,现在你会发现 Add、Sort 和 Edit 按钮,允许你添加曲目、更改播放列表的标题或封面,以及重新组织歌曲顺序。
位于澳大利亚、加拿大、爱尔兰、新西兰、南非、英国和美国的听众,将可以先通过按曲风过滤后,再点击全新的“转为播放列表”选项,从 Liked songs 中创建播放列表。
其他音乐策展工具的位置也有所调整。如今,用户可以点击移动应用右下角的 Create 按钮,以访问创建播放列表的工具、与朋友共同协作编辑播放列表以及加入 Blend(Blend 是一种将两个人的音乐品味融合在一起的播放列表,会包含双方都喜欢的歌曲)。
与此同时,Premium 订阅者可以点击 Create 按钮,使用全新的 AI Playlist 功能以及 Jam —— 一个实时共享播放队列的听歌会话,允许多人同时贡献曲目。
作为这次改动的一部分,Spotify 已将 Your Library 选项卡移动至其移动应用底部的第三个位置。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。