红帽近日表示,正在升级专门针对AWS客户的云原生和基于容器的应用开发平台Red Hat OpenShift。
Red Hat在本周举行的AWS re:Invent 2023大会上表示,Red Hat OpenShift Service on AWS(ROSA)将通过新增的托管控制平面而得到增强,为用户带来诸多好处,包括更低的成本、更高的运营效率、以及增强的可靠性和弹性。
ROSA平台于2021年首次推出,作为一种交钥匙型的应用开发平台,让企业能够更快地构建和部署业务应用,同时利用AWS云的规模和功能,从而让开发人员可以利用Amazon的原生云服务,专注于创新,而不用操心管理应用的底层基础设施。此外,客户还可以通过AWS Marketplace享受简化的计费方式。
ROSA是Red Hat OpenShift平台的专业版本,使用Kubernetes容器编排平台大规模构建和部署现代应用。有了它,企业就可以更轻松地创建运行在任何计算平台和任何位置的应用。
Red Hat表示,通过增加托管控制平面,客户将能够以多种方式从中受益。Red Hat表示,托管控制平面为他们提供了一个高度可用的控制平面,该控制平面与AWS基础设施内的其他应用相互隔离,可以更有效且更高效地利用云资源。
Red Hat承诺,对用户来说最显着的好处之一是降低了总拥有成本。根据Red Hat的研究表明,当客户部署带有托管控制平面的ROSA时,与在自己AWS账户中托管控制平面相比可以节省高达5倍的成本。
此外,客户可以根据需要更轻松地启动和拆卸集群,从而进一步节省成本。托管控制平面的另一个优点是让客户可以更轻松地更改节点类型。
效率的提高源于基础设施配置现在实现了完全自动化,这意味着部署新应用所需的时间更短了。此外,由于用户只需要等待工作节点,因此可以加速工作负载调度。最后,带有托管控制平面的ROSA无需自动扩展,因为现在已经完全自动化了。
Red Hat表示,在可靠性和弹性方面,卸载控制平面基础设施管理可以消除意外删除云资源的可能性,因为AWS管理员只需与工作负载交互,而不用与控制平面工件交互,这可以简化所有权模型,让用户有选择地分别升级控制平面和工作节点,从而拥有更多的控制和灵活性。
最后,Red Hat列出了一长串在ROSA平台中实施架构改进所带来的好处。据说最新版本在用户如何部署和管理ROSA集群方面引入了“范式转变”,例如,开发人员现在可以在云区域内的单个可用区域、两个区域或者所有区域中发布他们的应用,而无需担心控制平面的可用性,因为可用性始终是分布在多个区域的。
用户还能够快速为每个Kubernetes集群配置专用的、隔离的控制平面,可以选择将其公开或通过专用的AWS PrivateLink终端节点私下公开。
对于云管理员来说,他们将能够简化配置过程,其中各种资源已移出集群边界范围,他们可以通过ROSA命令行界面或OpenShift Cluster Manager工具直接配置单一的事实来源。
Red Hat还谈到了安全性方面的好处,由于控制平面与工作负载的解耦而加强了安全边界,控制平面也与工作节点升级分开,确保控制平面升级节奏更加一致和安全,而不会影响到这些节点。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。