微软近日公布了财报,云计算收入增长放缓,同时预警下一季度销售额将低于预期约20亿美元,微软股价在盘后交易中出现大幅下跌。
微软的第一财季业绩超出了预期水平,在不计入某些成本(如股票补偿)之后的每股收益为2.35美元,低于去年同期的每股2.71美元,略高于华尔街预测的每股2.31美元。
第一财季的收入同比增长11%,达到501亿美元,高于市场普遍预期的496.6亿美元,总利润为175.6亿美元。
微软公司董事长兼首席执行官Satya Nadella(如图)表示:“在一个面对越来越大逆风的世界中,数字技术是最终的顺风趋势。在这种环境下,我们专注于帮助客户变得事半功倍,同时投资于长期增长领域、并以严格的方式管理我们的成本结构。”
过去几年中微软大部分的增长动力都是来自于Azure云计算业务,最近有人担心随着美国进入潜在的衰退,这部分业务可能会失去动力。这些担忧似乎是有道理的,因为局微软透露,第一财季Azure的收入仅增长了35%,低于上个季度的40%,远低于一年前的50%。
这也是微软自两年前开始发布此类数据以来的最慢增幅。值得注意的是,微软仅公布了Azure的收入增幅,而竞争对手Azure和Alphabet都公布了更为详细的云收入情况。
微软首席财务官Amy Hood在电话会议上表示,当前这个季度Azure可能会出现类似的收入增长环比放缓,这让情况变得更加复杂了。她警告说,按固定汇率计算,增幅将减少5个百分点。此外她表示,本月早些时候微软裁员近1000人之后,正在考虑采取更多削减成本的措施。
她说:“我们持续帮助客户事半功倍,与此同时我们在公司内部也在做着相同的事情。今年我们的全年运营费用增长有望大幅放缓,同时在去年所做的人力投入方面,我们将着重提高其生产力。”
Hood在发出这一警告之前,还公布了微软第二财季预期,同样令人感到担忧。她告诉分析师,微软预计该季度的收入在523.5亿美元至533.5亿美元之间,低于分析师普遍预期的561.6亿美元,微软智能云业务部门(包括Azure)的销售额预计在212.5亿美元至215.5亿美元之间,略低于华尔街预期的218.2亿美元。
这个消息一出,微软股价在盘后交易中下跌超过6%,超过了当天早些时候略高于1%的涨幅,同时也引发了对整个云计算行业的担忧,Amazon的股价也下跌了4%多。
微软行业合作伙伴的反应则更为积极一些。数字化转型服务提供商Ensono公司的首席技术官Gordon McKenna表示,微软的业绩只是反映了每家大型科技公司最近几个月不得不做出的艰难财务决策。他没有详细展开,而是重点提及了微软对云业务的持续投资。
他说:“在今年的Ignite大会之后,微软持续进行投资,为企业组织打造最好的产品和平台来满足他们的所有需求,包括混合式办公、安全措施、云部署、AI工具等等。当我们现在身处于经济困境的时候,我预计微软将继续发展并依靠他们的合作伙伴来提供高质量的服务,从而帮助客户取得业务成果。”
不过,微软必须应对的不仅仅是云业务增长停滞不前,微软还受到了美元走强和个人电脑在经过新冠疫情期间销量飙升之后出现下滑的影响。根据财报显示,该季度微软的个人电脑收入为133亿美元,与一年前同期相比是持平的。
好文章,需要你的鼓励
香港大学等机构研究者开发的PHYX基准测试评估了AI模型的物理推理能力,结果显示即使最先进的GPT-4o等多模态模型在此类任务上的准确率仅为32.5%-45.8%,比人类专家低29%以上。PHYX包含3000个跨六大物理领域的多模态问题,要求模型整合领域知识、符号推理和现实约束理解。分析发现模型存在视觉推理错误、过度依赖文本描述和数学公式等关键缺陷,为未来开发物理感知AI系统提供了重要指导。
QwenLong-CPRS是阿里巴巴千问文档团队开发的创新上下文压缩框架,专为解决大型语言模型处理长文本的效率和"迷失在中间"问题。该技术通过自然语言引导的动态优化、双向推理层、基于语言建模的标记评价和窗口并行推理四大创新,实现了高达21.59倍的上下文压缩率和显著的性能提升。研究表明,配备QwenLong-CPRS的小型模型甚至能超越专业长上下文模型,为高效处理海量文本开辟了新途径。
这项研究介绍了MOOSE-Chem3,一种通过模拟实验反馈进行化学假设排序的创新方法。传统的预实验排序仅依靠大型语言模型的内部推理,而该研究提出的实验引导式排序方法则利用先前实验结果来优化决策。研究团队基于三个领域假设构建了高保真模拟器,并验证了其对124个真实化学假设的预测准确性。他们开发的CSX-Rank方法通过功能聚类和反馈分析,将找到最优假设所需的实验次数减少了一半以上,即使在嘈杂条件下也表现出色,为化学研究提供了更高效的探索路径。
FullFront是一项创新研究,首次全面评估多模态大语言模型在前端工程完整流程(从设计概念化到视觉理解再到代码实现)中的能力。研究通过精心设计的基准测试,包括网页设计、网页感知问答和网页代码生成三大核心任务,发现即使最先进的模型在精细视觉感知(如元素对齐、大小和间距)方面表现远低于人类专家,且在复杂布局和交互功能实现上仍存在显著局限。研究揭示了闭源模型普遍优于开源模型,但所有模型与人类专业水平间仍存在巨大差距,为未来AI辅助前端开发工具的改进提供了重要方向。