亚马逊网络服务公司(Amazon Web Services)已经开始提供一种云服务器,该服务器采用定制的第四代英特尔至强可扩展处理器,拥有96个内核或192个vCPU。
目前还不清楚这是一款比英特尔公开发售的至强处理器(60 核 Platinum 8490H)多36核的巨型芯片,还是一款采用较低处理器的双插槽服务器。
近日发布的一篇文章详细介绍了亚马逊弹性计算云(Amazon EC2)中心推出的M7i-Flex和M7i实例类型。这篇文章介绍了一种名为“m7i.48xlarge”的实例类型,可提供192个vCPU,而AWS的CPU选项页面上列出该实例默认提供96个CPU内核。
我们已经联系了AWS和英特尔询问这种定制芯片的规格细节,因为单个CPU已经远远超出了Chipzilla公开透露的数量范围。
无论M7i-Flex和M7i实例类型的服务器采用的是什么芯片,AWS都声称它们“提供的性能在所有云端同类英特尔处理器中是最好的——比其他云提供商使用的英特尔处理器快15%。”
M7I实例推荐适用于大型应用服务器和数据库、游戏服务器、基于CPU的机器学习和视频流。M7I-Flex被认为适用于网络和应用服务器、虚拟桌面、批处理、微服务、数据库和企业应用。据说Flex实例的性价比比普通M7I高5%,价格低5%。AWS还表示,运行在前几代通用实例上的应用程序可以迁移到 M7I,"无需对应用程序或工作负载进行调整"。
裸机M7I实例正在开发中,有96或192个vCPU。
如果英特尔真的推出了96核至强处理器,意义将非常重大。一个原因是,这将使第四代至强与AMD的竞品Genoa数据中心产品相比更具竞争力,后者的内核数量击败了英特尔的产品,因此计算密度也更优。
另一个原因是第四代至强白金版8490H的售价为每台17,000美元。由于AWS采购量大,无论核心数量多少,Chipzilla 都有可能在这里赚上一笔。
最后但并非是最不重要的一点是,无论是否是怪兽级的芯片,这款定制芯片都表明,即使是AWS正在推广自己基于Arm的Graviton CPU,该公司显然是认为更快的x86 CPU仍有用武之地。
在英特尔处理资产负债表的平衡问题之际,同全球顶级的CPU买家之一合作开发出功能强大的定制芯片的消息无疑会成为一剂强心针。
好文章,需要你的鼓励
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。