ZD至顶网软件频道消息: 近些天以来,微软Outlook.com服务的用户几乎每天都会问我一个问题,为什么他们还没有被迁移到“新的”Outlook.com上。
早在2015年5月,微软就宣布将会让Outlook.com变得更像是其“常规的”Outlook邮件客户端。在当时,微软的官员们表示他们已经开始为一小部分用户提供新的Outlook.com预览,然后“在未来几周之内”扩大预览版的使用范围。
微软表示,新Outlook.com将有大量的新功能,包括支持分类收件箱“Clutter”、邮件主题、自动链接预览生成、弹出阅读和撰写窗口等,另外还将支持诸如Uber、PayPal和Maps等插件。微软在去年年底表示,建议联系人和自动飞行通知也将成为Outlook.com功能的一部分。
到2016年2月,微软表示新的Outlook.com已经度过了预览阶段,并已经每周面向数百万Outlook.com用户推出了。可即便到四月底,除了那些去年新创建的账户,旧Outlook.com用户只有很少一部分被迁移到新的Outlook.com之上了。
为什么新的Outlook.com推出看起来似乎永远没完没了?
Outlook市场营销总监Jon Orton透露,Outlook.com账户总数为4亿个,目前微软已经将超过1.75亿Outlook.com账户迁移到了新的平台上。
Orton表示,将现有的Outlook.com用户转移到新的Outlook.com“可不仅仅是一次整容”,“这次的规模同之前从Hotmail到Outlook.com的迁移相比要大得多,而且我们迁移的并不仅仅是用户界面和体验,还要将数据转移到Office 365中。”
据悉,现有的Outlook.com服务运行在传统的基础架构之上。他表示,新的Outlook.com“和其他的Office 365使用了一样的构件”。这样新功能在未来就能够更快、更容易地引入Outlook/Office 365和Outlook.com之中,而不用针对两个不同的平台建设两次。
Orton承认,微软扩展了预览时期(从2015年5月至2016年2月)。在这段时间里,微软就这项新服务获得了大量的反馈,并积累了很多转型的经验,这让这家公司进行了大量的“改进和修正”。
另外,Orton表示,微软正在将不同的用户组在不同的时间内进行转移,但具体将哪些用户优先迁移到新的服务版本之上是有条件筛选的。
“决定迁移哪些用户以及何时迁移取决于用户使用的功能。” Orton表示,“例如,如果你正在使用共享日历,在迁移的过程中就需要特别注意到这一点。”
对于迁移截止时间,Orton只是说,“我们预计绝大部分Outlook.com的用户都将在今年夏天结束之前完成升级。”
对于微软打算何时将它的Outlook Mobile(Acompli)邮件客户端放在同Outlook以及Outlook.com同样的后端平台上,我也感到十分好奇。(它在运营过程中至少是部分地使用了Amazon Web Services。)
Orton表示至今为止仍然没有公布具体的时间安排,“移动依靠着一个云计算层处理搜索以及同诸如Focused Inbox之类的文件服务的连接。”他表示,“我们还需要做一些工程工作,使它同Outlook和Outlook.com的基础架构统一。”
好文章,需要你的鼓励
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
Scale AI团队推出SWE-Bench Pro测试平台,专门评估AI编程助手在真实企业级软件开发中的表现。研究发现,即使是最先进的GPT-5和Claude模型,成功率也仅有23%左右,远低于在传统测试中70%的表现。该测试平台包含1865个来自真实企业的复杂编程任务,要求修改多个文件和大量代码,为AI编程能力提供了更严格的现实检验。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
微软团队开发的EdiVal-Agent是首个针对AI图像编辑的自动化评估系统,能像专业评委一样从指令遵循、内容一致性和视觉质量三维度评分。该系统与人类评审一致性达81.3%,测试发现Nano Banana表现最均衡,GPT-Image-1指令遵循最佳但一致性不足,大多数模型在数量变化任务中成功率低于25%。