红帽近日表示,正在升级专门针对AWS客户的云原生和基于容器的应用开发平台Red Hat OpenShift。

Red Hat在本周举行的AWS re:Invent 2023大会上表示,Red Hat OpenShift Service on AWS(ROSA)将通过新增的托管控制平面而得到增强,为用户带来诸多好处,包括更低的成本、更高的运营效率、以及增强的可靠性和弹性。
ROSA平台于2021年首次推出,作为一种交钥匙型的应用开发平台,让企业能够更快地构建和部署业务应用,同时利用AWS云的规模和功能,从而让开发人员可以利用Amazon的原生云服务,专注于创新,而不用操心管理应用的底层基础设施。此外,客户还可以通过AWS Marketplace享受简化的计费方式。
ROSA是Red Hat OpenShift平台的专业版本,使用Kubernetes容器编排平台大规模构建和部署现代应用。有了它,企业就可以更轻松地创建运行在任何计算平台和任何位置的应用。
Red Hat表示,通过增加托管控制平面,客户将能够以多种方式从中受益。Red Hat表示,托管控制平面为他们提供了一个高度可用的控制平面,该控制平面与AWS基础设施内的其他应用相互隔离,可以更有效且更高效地利用云资源。
Red Hat承诺,对用户来说最显着的好处之一是降低了总拥有成本。根据Red Hat的研究表明,当客户部署带有托管控制平面的ROSA时,与在自己AWS账户中托管控制平面相比可以节省高达5倍的成本。
此外,客户可以根据需要更轻松地启动和拆卸集群,从而进一步节省成本。托管控制平面的另一个优点是让客户可以更轻松地更改节点类型。
效率的提高源于基础设施配置现在实现了完全自动化,这意味着部署新应用所需的时间更短了。此外,由于用户只需要等待工作节点,因此可以加速工作负载调度。最后,带有托管控制平面的ROSA无需自动扩展,因为现在已经完全自动化了。
Red Hat表示,在可靠性和弹性方面,卸载控制平面基础设施管理可以消除意外删除云资源的可能性,因为AWS管理员只需与工作负载交互,而不用与控制平面工件交互,这可以简化所有权模型,让用户有选择地分别升级控制平面和工作节点,从而拥有更多的控制和灵活性。
最后,Red Hat列出了一长串在ROSA平台中实施架构改进所带来的好处。据说最新版本在用户如何部署和管理ROSA集群方面引入了“范式转变”,例如,开发人员现在可以在云区域内的单个可用区域、两个区域或者所有区域中发布他们的应用,而无需担心控制平面的可用性,因为可用性始终是分布在多个区域的。
用户还能够快速为每个Kubernetes集群配置专用的、隔离的控制平面,可以选择将其公开或通过专用的AWS PrivateLink终端节点私下公开。
对于云管理员来说,他们将能够简化配置过程,其中各种资源已移出集群边界范围,他们可以通过ROSA命令行界面或OpenShift Cluster Manager工具直接配置单一的事实来源。
Red Hat还谈到了安全性方面的好处,由于控制平面与工作负载的解耦而加强了安全边界,控制平面也与工作节点升级分开,确保控制平面升级节奏更加一致和安全,而不会影响到这些节点。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。