微软正在为Windows 11开发一项名为"低延迟配置文件"的高性能模式,据报道可实现应用加载速度提升40%、界面启动速度提升70%。该功能通过短暂将CPU拉至最高频率来实现性能跃升,每次加速持续1至3秒,在启动应用或加载界面时自动触发,用户无需手动开启。此功能属于微软Windows K2项目的一部分,旨在提升系统响应速度,推动用户从Windows 10迁移至Windows 11。
MongoDB在伦敦.Local大会上发布MongoDB 8.3,相比8.0版本读取性能提升45%、写入提升35%、高完整性事务提升15%、复杂操作提升30%,且无需修改任何代码。新版本还推出自动化向量嵌入功能(公开预览),简化AI智能体的数据检索流程。此外,LangGraph.js长期记忆存储正式上线,支持JavaScript和TypeScript开发者使用智能体记忆系统,并新增AWS PrivateLink跨区域安全连接功能。
高通发布骁龙6 Gen 5与骁龙4 Gen 5两款中端芯片,重点改善安卓手机卡顿问题。骁龙4 Gen 5采用2+6核心架构,GPU性能提升77%,支持90Hz游戏;骁龙6 Gen 5采用4+4核心架构,支持Wi-Fi 7、200MP摄像头及蓝牙6.0。两款芯片均引入"骁龙流畅动态UI"技术,骁龙6 Gen 5应用启动速度提升20%,骁龙4 Gen 5提升幅度更达43%。前者将率先搭载于荣耀和Redmi设备,后者将出现在OPPO、Realme和Redmi设备中。
DuckDB Labs正式发布生产就绪版本DuckLake v1.0,旨在解决基于Apache Iceberg和Delta Lake等开放表格式的湖仓架构中普遍存在的"小变更"问题。该方案通过关系型数据库管理元数据,将小批量数据变更暂存于数据库中,待积累到一定规模后再统一写入Parquet文件,避免频繁生成小文件导致的性能损耗。官方基准测试显示,与Iceberg相比,查询速度提升926倍,数据摄取速度提升105倍。
亚马逊推出mlkem-native高保证、高性能的ML-KEM C语言实现,结合参考实现的简洁性与研究优化及形式化验证。利用CBMC和SLOTHY等自动化工具确保内存安全、类型安全和功能正确性,在数学确定性基础上实现激进的汇编优化。相比ML-KEM参考实现,mlkem-native在不同EC2实例上每秒操作数提升2.0到2.4倍,同时保持安全性和可维护性。
AMD AI团队总监Stella Laurenzo在GitHub上发布问题报告,指控Claude Code自二月份更新以来性能大幅下降。通过分析6852个会话和234760次工具调用,数据显示违规行为从零增至每日10次,代码阅读次数从平均6.6次降至2次。问题可能源于3月初部署的思考内容删减功能,导致AI思考深度不足,出现不完整编辑、提前停止和逃避责任等"懒惰"行为。AMD团队已转向其他AI工具。
亚马逊正在销售13英寸M5苹果MacBook Air,配备16GB内存和512GB固态硬盘,售价仅950美元,比原价节省149美元。15.3英寸版本同样享受149美元折扣,售价1050美元。M5芯片带来显著性能提升,在单核和多核测试中均超越前代M4。新款MacBook Air配备Liquid Retina显示屏,电池续航长达18小时,还具备指纹识别、背光键盘和1200万像素摄像头等功能。
OpenStack社区发布2026.1版本(代号Gazpacho),在计算、裸机、网络和存储方面带来重大改进。本次更新由来自100个组织的500名贡献者完成,包含9000项代码变更。主要特性包括Nova项目的并行实时迁移功能,支持多线程内存传输以提升性能;增加vTPM实例的实时迁移支持;Ironic裸机服务新增自动检测部署接口;Neutron网络项目的OVN驱动新增BGP支持和南北向路由功能。此版本重点响应VMware用户迁移需求,并加强对AI推理工作负载的支持。
甲骨文发布Java 26,包含10个JDK增强提案,涵盖HTTP/3网络支持、垃圾回收效率、加密工具等改进。虽非长期支持版本,但在性能优化方面表现突出,特别是G1垃圾回收器同步开销减少和延迟常量功能,后者对AI工作负载尤其重要。新版本还支持结构化并发、移除过时的Applet API,并引入Java验证产品组合。甲骨文同时宣布Project Detroit项目,允许Java调用JavaScript和Python运行时。
大语言模型本地运行系统Ollama宣布支持苹果开源机器学习框架MLX,同时改进缓存性能并支持英伟达NVFP4模型压缩格式。这些更新将显著提升搭载M1及后续芯片的Mac设备性能。目前该功能处于预览阶段,仅支持阿里巴巴Qwen3.5模型,需要32GB内存。随着开发者对云服务费用和限制的不满,本地模型运行需求激增,虽然性能仍落后于云端模型,但在隐私保护和成本控制方面具有优势。
英特尔发布面向商用PC的Core Ultra系列3处理器,集成vPro技术,已获得超过125款设计采用,包括戴尔和惠普新发布的系统。新芯片相比四年前系统性能提升30%以上,图形性能提升80%,AI性能提升4倍。增强的vPro平台包括认证程序、AI驱动的设备智能分析、云端管理服务和安全威胁检测功能。搭载该技术的商用PC将于3月31日开始供应。
英伟达发布DLSS 4.5更新,为RTX 50系列显卡带来动态多帧生成和6倍多帧生成功能。该技术利用AI算法最多可生成6倍帧数,支持4K 240Hz和1080p/1440p 360Hz高刷新率游戏体验。动态多帧生成功能可自动平衡刷新率、画质和响应速度,而6倍多帧生成基于第二代变换器模型,可将4K帧率提升35%。
谷歌研究团队最新发布的TurboQuant压缩算法,能够在保持准确性的同时大幅减少大语言模型的内存占用并提升运行速度。该算法通过PolarQuant技术将向量坐标从标准XYZ坐标转换为极坐标系统,并结合量化约翰逊-林登施特劳斯技术进行误差修正。测试结果显示,该算法可将键值缓存的内存使用量减少6倍,性能提升8倍,且无需额外训练即可应用于现有模型。
微软宣布将大幅改进Windows 11系统质量,此前公司公开承认该操作系统在性能方面存在不足。用户一直面临系统不一致、反复出现的错误和性能问题。微软现已制定明确路线图,重点改善系统响应速度、稳定性和整体体验一致性。计划包括优化核心功能、减少资源占用、改善更新机制、增强AI集成透明度等措施。
英特尔发布Core Ultra 200S Plus桌面处理器系列,针对预算紧张的PC玩家推出更具性价比的产品。Ultra 5 250K和Ultra 7 270K分别售价199美元和299美元,相比上代产品提供更多核心数和更激进的频率曲线。新芯片在多线程性能方面较AMD入门级处理器有83-103%的优势,并通过二进制优化工具在游戏中平均提升8%的性能。虽然在游戏性能上无法与AMD的X3D处理器竞争,但其显著更低的价格和在生产工作负载中的强劲表现使其成为极具吸引力的选择。
斯坦福兼职教授Zain Asgar创立的初创公司Gimlet Labs获得8000万美元A轮融资,由Menlo Ventures领投。该公司开发了首个"多芯片推理云"软件,能够将AI工作负载同时分布在不同类型硬件上运行,包括传统CPU和AI优化GPU。公司声称可将AI推理速度提升3-10倍,同时保持相同成本和功耗。
NVIDIA RTX PRO 6000 Blackwell工作站版为数据科学和AI工作流提供终极加速性能。这款强大稳定的工作站支持实时渲染、快速原型设计和无缝协作。最多支持四个GPU,用户可在桌面获得数据中心级别的性能。通过CUDA-X和NVIDIA企业软件栈优化AI工作流程,实现Python零代码变更加速,支持超过100个AI应用。相比传统CPU工具,数据处理速度提升50倍,大幅降低成本并增强数据安全保护。
技嘉X870E AORUS ELITE X3D主板搭载AMD Radeon RX 9070显卡,提供顶级游戏图形性能。配备AI增强的X3D Turbo Mode 2.0技术,可在极限游戏模式和最大性能模式间切换,实时优化参数。采用Zenith内存性能技术,通过先进屏蔽、菊花链布线和8层服务器级PCB材料,确保DDR5高速数据传输。全金属散热设计配合M.2 EZ-Flex专利技术和Smart Fan 6静音风扇,保证系统长时间稳定运行。
AI基础设施性能讨论往往聚焦于加速器指标,但生产环境中,数据需要经过摄取、暂存、转换、安全、调度等流程才能完成训练任务。大规模AI性能由整个系统协调能力决定,而非单纯计算速度。CPU作为主机和控制平面,管理数据管道、协调节点计算、维护隔离边界。随着AI工作负载扩展推动数据中心达到功耗和散热极限,每瓦性能变得更加关键,基于Arm的CPU正成为超大规模平台标准。
NetApp发布两款全新E-Series全闪存存储阵列EF50和EF80,专门针对AI训练、推理和高性能计算工作负载。新产品性能提升2.5倍,EF80读取吞吐量超过100GBps,写入吞吐量达57GBps。在2U机箱中集成1.5PB存储容量,有效解决GPU密集环境中的数据饥饿问题,降低数据中心功耗和冷却需求。