ZD至顶网软件频道消息: 谷歌承认自己的云出问题了。而且是“再一次”。
最近的发生混乱发生于6月28日,us-central1-a 中的Google Compute Engine SSD Persistent Disks“在一个区域内经历了高层写入延迟和错误,这种情况持续了211分钟。”这场混乱意味着磁盘可能停止接受写入,而将SSD作为根分区的实例有可能会挂起。
虽然,谷歌云平台除了故障,但是谷歌对故障的披露方面还算令人信服。对于此次问题,谷歌表示:“两个并发的日常维护事件触发了Persistent Disk底层的分布式存储系统中的数据再平衡。”
不过用户不用担心这种“再平衡”,因为“这种再平衡旨在让维护时间对用户不可见,通过在不可用的存储设备和机器上平均地重新分布数据来实现。”
这正是云平台应该做到的:很多部件都在后台运行,对你来说是不可见的,它们维持着服务器的正常运转。
但是这一次,“一个以前没有发现的软件bug,由两个并发的维护事件触发,意味着因为再平衡变得不可用的磁盘块没有释放供随后再度使用,消耗了这个区域中的可用SSD空间,直到写操作被拒绝才被发现。”
一旦磁盘认为它们已经用光了所有的空间,就没有更聪明的机制在后台纠正这一错误了,以至于谷歌花了211分钟才找到问题并且解决问题。
和往常一样,谷歌承诺未来会做得更好,并且表示其“工程师正在改进自动监控,这样如果问题再次出现,工程师将会在用户受到影响之前就得到预警。我们还改进了我们的自动化,以更好地协调同一区域内不同的维护操作,减少必要情况下还原此类操作所需要的时间。”
正如我们在之前提到的,谷歌在面临故障及其产生原因的时候,比其竞争对手更加坦率。但是这家公司似乎也有更多的故障需要披露:《The Register》监测了三大云平台的故障通告,谷歌发布的问题数量比AWS和微软都要多,而这两家公司的云平台规模更大,产品也更多。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。