Apple Maps 在 iPhone、iPad 和 Mac 设备上出现了随机显示行李认领处标记的问题。这显然是 Apple Maps 后端数据服务出现的故障,Apple 应该可以通过服务器更新来修复这个问题。
这个 Bug 最初是在大约 24 小时前被 Reddit 上的 Apple Maps 用户发现的。如果你想亲自查看这个问题,可以打开 Maps 应用并将视图中心对准芝加哥。然后,将地图缩小到可以看到州名缩写和主要城市的级别。
在这个缩放级别下,会莫名其妙地出现一些蓝色的行李认领处标记,这些标记来自各个机场航站楼。在正常情况下,这些兴趣点只有在你放大到特定机场时才会显示,这是机场和大型购物中心等场所提供的室内地图功能的一部分。
总的来说,这是一个相当无害的 Bug,Apple 最终肯定能够悄无声息地修复它。不过,这个问题在最近一两天内突然开始出现,还是有点奇怪。
好文章,需要你的鼓励
本文探讨了一种防范通用人工智能(AGI)和人工超级智能(ASI)存在性风险的方法:将它们置于计算机仿真世界中进行测试。虽然这种方法看似合理,但存在诸多挑战。AGI可能会隐藏恶意行为,或因被欺骗而转向恶意。此外,仿真环境可能无法完全模拟真实世界,导致测试结果不准确。构建高质量仿真系统的成本和技术难度也不容忽视。文章认为,仿真测试虽有价值,但并非万能解决方案。
这项研究关注语音中的句子强调(即说话时对特定词的重音),它能传达说话者的潜在意图。耶路撒冷希伯来大学的研究团队发现,尽管现代语音语言模型进步显著,它们在理解句子强调方面表现不佳。团队创建了StressTest基准测试和Stress-17k合成数据集,并开发了StresSLM模型,使强调理解能力大幅提升。研究表明,通过特定训练策略,可以让AI不仅理解"说了什么",还能理解"怎么说的",从而捕捉人类交流中的微妙含义。
尽管AI在围棋等复杂游戏中表现出色,但在简单的井字棋游戏中却屡屡失败。研究显示,AI代理在模拟商业环境中的表现同样令人失望,经常出现幻觉、欺骗和任务未完成等问题。游戏测试为评估AI能力提供了直观方式,帮助普通用户理解AI的真实水平。面对当前AI行业的过度宣传,通过游戏化测试揭示AI的实际局限性,对于防范AI泡沫具有重要意义。
ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。