微软和英伟达宣布新合作计划,将分别向AI公司Anthropic投资50亿和100亿美元,同时Anthropic承诺向微软云服务投入300亿美元。此举旨在减少AI行业对OpenAI的依赖,但也凸显了AI投资的循环性质。根据协议,Claude模型将通过微软、亚马逊、谷歌三大云服务商提供服务,而Anthropic将与英伟达在芯片和模型优化方面展开合作。
VAST Data将其AI操作系统软件栈移植到Azure平台,作为托管服务提供。该AI操作系统包含DataSpace、DataBase、DataStore等多层数据服务,构建在DASE存储架构之上。此次合作使客户能够在本地VAST部署、云环境和Azure之间无缝迁移工作负载,形成跨环境的混合AI数据架构。VAST正在构建覆盖主流公有云的全球存储数据架构。
DDN在SC25大会上发布了全新的CORE AI和HPC统一数据平面,整合了EXAScaler Lustre文件存储和Infinia对象存储系统,并推出A1400X3i和A12200新硬件。该公司声称其存储系统支持超过11000个客户的100万个GPU。CORE作为软件抽象层,统一管理本地部署和公有云实例,提供一致的AI数据性能,支持从模拟到训练、推理和检索增强生成的整个AI生命周期。
微软在旧金山Ignite大会上发布了新一代Cobalt 200 CPU,性能较前代提升50%,同时推出新的Azure AI工具用于构建和部署生成式及代理AI应用。该芯片专为Azure云原生应用优化,目前处于预览阶段。微软还宣布了Azure AI平台的多项增强功能,包括支持模型上下文协议、模型路由器等创新特性。
随着AI技术不断发展,交通运输行业正迎来重大变革。MIT研究显示,AI将很快自动化价值650亿美元的交通工作,大幅提升运输效率。从陆地到海空,AI正在推动全方位的交通创新。斯坦福专家强调,AI将通过基础模型、合成数据和数字孪生等技术,实现从单一车辆自动化到整个交通网络优化的跨越式发展,同时解决可持续性、安全性和公平性等关键挑战。
波兰研究团队开发ORCA数学基准测试,对五个主流大语言模型进行评估。结果显示ChatGPT-5、Gemini 2.5 Flash、Claude Sonnet 4.5、Grok 4和DeepSeek V3.2的准确率均低于63%。测试涵盖生物化学、工程建筑、金融经济等七个领域的500道数学题目。研究发现模型主要在四舍五入和计算错误方面存在问题,表明自然语言推理进步并未直接转化为可靠的计算能力。
美国能源信息署预测,2026年批发电力价格将上涨8.5%至每兆瓦时51美元,主要由数据中心和加密货币挖矿需求驱动。尽管可再生能源发电比例将达到创纪录的26%,加上核电18%的贡献,无碳发电将占总量44%,但整体碳排放变化不大。AI数据中心的快速增长成为电力需求最大推动因素,谷歌宣布到2027年在德州增投400亿美元建设数据中心。
GMI Cloud在台湾投资5亿美元建设AI工厂数据中心,将使用VAST Data存储系统为7000个Blackwell GPU提供数据支持。该项目与英伟达合作,GPU将配备NVLink、InfiniBand和Spectrum-X以太网网络,部署在96个机架中,每秒可处理约200万个令牌,功耗16兆瓦。VAST的EB级数据基础设施支持模型训练、推理和实时数据处理。
两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。
谷歌宣布在搜索中推出新的AI驱动旅行预订和规划功能。公司将AI驱动的"飞行优惠"工具扩展到全球200多个国家和地区,支持60多种语言。新增的Canvas工具可帮助用户在AI模式下制定旅行计划,整合实时搜索数据、航班酒店信息和地图评价。此外,AI模式的代理预订功能现已向所有美国用户开放,可协助预订餐厅、活动门票等服务。
到2026年,AI数据中心年耗电量将超过90太瓦时。国际能源署最新报告显示,AI正迫使数据中心、公用事业和技术供应商重新思考电力生产、传输和消耗方式。Dell Technologies和Lancium高管在数据中心世界电力会议上讨论了这一快速变化的格局,其中电力可用性、电网集成和机架级工程已成为支持AI增长的核心要素。
甲骨文在科技股抛售潮中跌幅领先,过去一个月股价下跌25%,几乎是其他大型科技公司跌幅的两倍。公司为进军AI领域承诺未来几年投入数千亿美元建设芯片和数据中心,主要用于向OpenAI提供算力服务。然而,激进的举债扩张策略引发投资者担忧,其长期债务已从750亿美元增至960亿美元,预计2028年将飙升至2900亿美元。分析师警告称,甲骨文过度依赖OpenAI等少数AI公司存在巨大信贷风险。
戴尔在超级计算大会2025上宣布闪电项目已成功将PowerScale并行化,显著提升文件读写性能。通过pNFS和Flex Files布局支持,PowerScale实现了元数据服务器与客户端间的双向通信,在集群多个节点间实现更好的并行数据分布。新增NIXL库KV缓存卸载集成,支持软件订阅许可模式。ObjectScale新增AI优化搜索功能,包括S3表格和向量搜索API。
亚马逊云服务宣布AI开发环境Kiro正式上线,该工具通过自然语言提示快速构建软件。Kiro独特之处在于先生成规范文档,包含清晰需求、结构化设计和测试任务。新版本支持团队协作,管理员可统一管理访问权限和成本。团队可共享引导文件,为Kiro提供编码约定和环境知识。此外还推出集成开发环境和命令行界面,提高开发效率。
前英特尔芯片设计师Joe Fioti创立的Luminal公司宣布完成530万美元种子轮融资,由Felicis Ventures领投。该公司专注于优化GPU编译器技术,通过改进代码与GPU硬件之间的编译系统来提升计算效率。与专注于GPU硬件的云计算公司不同,Luminal致力于从现有基础设施中挤出更多计算性能。公司瞄准英伟达CUDA系统的开源部分,为客户提供推理优化服务,在AI模型运行速度和成本优化方面寻求突破。
MCP安全初创公司Runlayer宣布完成1100万美元种子轮融资,投资方包括Khosla Ventures的Keith Rabois和Felicis。该公司由三度创业者Andrew Berman创立,专注于为AI代理提供全方位安全防护。自四个月前隐秘发布产品以来,已签约数十家客户,包括Gusto、Rippling等8家独角兽公司。Runlayer提供集网关、威胁检测、可观测性和企业开发于一体的安全解决方案,旨在解决MCP协议本身缺乏安全机制的问题。