本周一,AWS在re:Invent大会有关基础设施的主题演讲中,展示了用于Elastic Compute Cloud的新CPU芯片硬件,新版本的Nitro管理程序,以及支持该芯片的实例。
Amazon表示,全新的Graviton3E芯片是对Graviton系列产品线的升级,与标准Graviton3相比具有显着的性能改进,在基于矢量的工作负载上性能有35%的提升。
AWS效用计算高级副总裁Peter DeSantis(如图)在主题演讲中解释说,该芯片在用于生命科学和金融建模等方面时有更突出的表现,并且针对矢量工作负载和浮点工作负载进行了优化,这些工作负载在高性能计算领域很常见,尤其是涉及金融、天气预报、生命科学、材料科学和化学等大规模数据建模的研究。
基于Arm定制处理器的Graviton系列是由AWS开发的,旨在以更低的成本在EC2中为客户提供卓越的高性能计算。Graviton3在运行某些应用时的性能水平比Graviton2高出80%,甚至显着改善了加密和视频编码。
而此次推出的Graviton3E,将支持一套全新的EC2实例,包括即将推出的HPC7G实例,用于200 GB专用网络带宽的高性能计算工作负载。该实例有多种配置选择,最多64个虚拟CPU和128GiB内存,不过这些实例要到2023年才会上线。
Graviton3E处理器还将可用于C7gn实例,该实例主要针对网络密集型工作负载,例如虚拟网络设备——防火墙、虚拟路由器、负载均衡器和类似服务——数据分析和紧密耦合的计算集群。Graviton3E能够支持200 Gbps的网络带宽,数据包性能提高200%。这些实例今天已经推出了预览版。
DeSantis解释说,这两个新的实例都将采用今天发布的Nitro 5硬件管理程序,这款新的第五代Nitro卡几乎将板载计算能力翻了一番,同时DRAM带宽增加了50%,每秒数据包增加60%,延迟降低30%,每瓦性能提高40%。
DeSantis表示,有了新的Nitro,C7gn实例将以最低延迟和最高吞吐量实现数据包处理性能高达50%的提升。
据他称,之所以能够做到这一点,是因为AWS团队将Nitro定制芯片上的晶体管数量增加了一倍。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
LongLive-RAG由英伟达、USC与MIT联合提出,通过让AI检索自身生成的历史视频片段作为参考,解决长视频生成中的角色漂移和画面不一致问题。