Oracle在自己的Oracle Cloud Infrastructure平台上推出了首个基于Arm的云计算产品,为客户提供了更多选择和灵活性。
今天Oracle表示,新产品名为OCI Ampere A1 Compute,旨在支持通用型和云原生型工作负载,这些工作负载不仅要求更高的性能,而且成本是可管理的。据称,该产品基于由Ampere Computing打造的Ampere Altra架构。
Oracle宣布这一公告,正值Oracle正在向更广泛的Arm生态系统进行重要投资的时候。Oracle推出了更多资源和工具,包括一种新的开发环境,面向那些希望支持Arm应用开发的开发者。
Arm的CPU以其高效、灵活和可扩展的架构而闻名,在诸如智能手机之类的小型设备中被广泛使用,不过近几年也逐渐延伸到用于个人计算机和物联网、再到计算机服务器甚至是超级计算机提供动力。
Oracle表示,此次推出的新Arm计算实例提供了多种选项和大小选择,可以适应几乎任何工作负载,其中包括Oracle所谓业界首款基于Arm的、灵活的虚拟机,其大小可以根据不同的工作负载进行适当调整,此外还有更强大的逻辑服务器选项。
Oracle表示,对于企业而言,Arm是x86实例的理想替代选择,适用于各种工作负载。例如,OCI Ampere A1 Compute实例可用于运行Web服务器、应用服务器和容器工作负载,因为它的大小可选,意味着客户可以在所需的性能和承受的成本之间取得平衡。Oracle称,Arm实例还很适合内存内缓存及数据库、移动应用开发、以及诸如人工智能训练、推理和媒体转码之类的计算密集型任务。
Oracle云基础设施计算产品副总裁Matt Leonard在接受采访时表示,过去企业使用很多不同的CPU架构来运行不同种类的工作负载,在20世纪90年代,基于Sparc、MIPS、PowerPC、Itanium和x86的架构十分普遍。之后,整个行业开始朝着基于英特尔x86处理器的方向发展,因为单一架构让企业可以更轻松地开发出能够运行在任何位置的统一工具集。而现在,随着客户要求有更多选择来应对不同的工作负载,我们看到了趋势上正在发生逆转,Leonard表示。“Arm对于整个行业来说正在变得越来越重要。我们现在看到的,正是对各种选项的再一次扩展。Arm的低成本和低功耗为客户带来了机会,因为特定工作负载的需求是不同的。”
异构计算正在成为云服务提供商的新阵地,他们正在争相提供客户所需的额外选项。IDC分析师Ashish Nadkarni认为,随着客户转向采用云原生的方法来满足性能密集型计算应用的需求,因此,他们毫无疑问会增加支出购买提供商提供的Arm实例。此次Oracle宣布推出面向OCI和Cloud@Customer的Arm实例,是在这个大背景下赢得企业客户的及时之举。
OCI Ampere A1 Compute实例让Oracle具备了相对其他云提供商的竞争优势,例如谷歌和微软,目前都不提供基于Arm的计算选项,不过据说至少微软正在努力解决这个问题。
今天的公告也意味着Oracle将与AWS实现某种程度的对等,后者在2018年推出了基于Arm的Graviton处理器,而Oracle使用的是Ampere架构。
Constellation Research分析师Holger Mueller说:“我们正处于多处理器厂商时代,很多不同的处理器平台都在争夺企业工作负载。云基础架构提供商需要提供这些处理器平台来吸引相关的工作负载。Arm是实现高能效、成本效益、具备边缘能力应用的一个重要平台,OCI Ampere A1 Compute实例让客户能够获得更多的处理选项。”
当然Oracle表示,这个新选项是目前最佳选择之一,在性能和定价方面有重大优势。OCI Ampere A1 Compute是第一款以云方式定价的、基于Arm的核心服务器,价格每小时每个核心1美分,每小时每GB随机数据0.0015美元。此外还提供了线性扩展功能,确保每个核心的性能不会随着客户增加核心数量而下降,以确保性能水平是可预测的。
OCI Ampere A1 Compute虚拟机的选择范围最多可达到80个CPU,每个核心配置1GB-64GB的内存,而专为更密集工作负载设计的裸机实例则最多可提供160个核心。
IDC分析师Kuba Stolarski表示,Oracle的数据令人印象深刻,OCI Ampere A1 Compute似乎是一个极具吸引力的选择。A1 Compute实例具有较低的入门成本,可变的部署规模、以及通过Cloud@Customer在公有云中或者在内部环境部署的能力,可提供长期可扩展性与近期可访问性的最佳组合。
未来Oracle可能会向云中增加更多的Arm CPU选项。因为有长期合作关系,所以Oracle首先提供的是基于Ampere的Arm芯片,虽然未提供细节,但他表示,Oracle正在“探索其他Arm选择”。
无论如何,很明显Oracle希望进一步扩展并在未来更广泛的Arm生态系统中发挥关键作用。Oracle表示,今天宣布加大投资,旨在鼓励开发者基于Arm架构开发更多可以运行在Oracle云上的应用。
为此,Oracle宣布推出新的基于Arm的计算资源Oracle Cloud Free Tier,该产品可在30天之内为开发人员提供高达300美元的免费信用额度,以使其平台运转起来。Oracle还推出了一款名为Always Free Arm的产品,可为开发者提供4个A1核心和24GB内存。 Oracle的Arm Accelerator计划则为那些需要Cloud Free Tier无法提供的功能的开发者、大学及其他客户提供长达12个月的Oracle Cloud积分。
更有意思的是Oracle宣布推出的新开发堆栈,一组在基于Arm的A1实例上提供的开发者工具,其中包括了Oracle Linux、Java、MySQL、GraalVM和用于Kubernetes服务的Oracle容器引擎。Oracle还创建了一个Oracle Linux Cloud Developer映像,该映可以安装、配置和启动部署在OCI上的开发环境。
Oracle云基础架构执行副总裁Clay Magouyrk说:“我们让开发者能够更容易迁移他们的应用,以及开发运行在Oracle Cloud Infrastructure上的新应用。”
作为对开发者的承诺,Oracle表示,将与众多开源合作伙伴(如GitLab、Jenkins、Rancher Labs、Datadog)展开合作,并且加入了Continuous Delivery Foundation开源社区,该社区承载了很多重要的开源持续集成/持续交付软件项目。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。