Red Hat发布了一个OpenShift容器化平台的技术预览版,该平台可以驱动跨x86和Arm芯片的集群。
Red Hat 2022年3月发布的OpenShift 4.10版本,现在可以在Amazon Web Services Arm支持的Graviton CPU上运行了。当时,RedHat表示该版本“只是我们OpenShift on Arm计划的开始,在接下来的版本中,将会看到在x86上运行的附加功能越来越多地可用于OpenShift on Arm。”
这家IBM的子公司的新一代版本(4.11版)于本周早些时候推出,增加了基于代理的安装程序、支持更多部署配置,包括在Nutanix环境中运行的能力,以及更高级别的FedRAMP合规性,还有一个技术预览版。
Red Hat在公告中表示,并非用户依赖的所有应用程序和服务都可以在Arm上使用。虽然该公司认为这个问题随着时间的推移会自行解决,但“我们也不想在短期内停止采用。”这就是为什么Red Hat喜欢在不同架构的计算节点中采用完全异构集群的思路。
公告宣称:“有了这个功能,用户可以在一个OpenShift 集群中并排运行这些Arm和x86应用程序。”
但它没有说明该功能何时可用于生产,或者在微软的Azure云之外使用,微软的Azure云是目前唯一可以运行异构集群的地方。
该公告指出:“你将能够在现有的OpenShift x86集群中添加基于Arm的节点进行优化。”
“在未来的版本中还会有更多关于此功能的内容,但是我们觉得你会高兴能够有一点早期的尝试来真正激发你的胃口。”
想象一下Kubernetes 管理容器在不同架构上运行,充分利用每种架构的功能或价格结构。再想象一下,IBM最终可能在自己的云上提供Arm产品,因为OpenShift是IBM的首选平台。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。