至顶网软件频道消息: 微软日前开始在Azure里添加对NVIDIA GPU项目的新级别支持,此举可能令运行深度学习和其他高性能计算(HPC)工作负载的人受益。两家宣布推出配有GPU加速软件的预配置容器,可助数据科学家、开发人员和研究人员在运行HPC任务之前省掉许多整合和测试步骤。
客户可以选择35个GPU加速容器,可用于深度学习软件、HPC应用程序、HPC可视化工具等,这些工作负载都可以在以下配有NVIDIA GPU的微软 Azure实例类型上运行:
● NCv3(1、2或4个NVIDIA Tesla V100 GPU)
● NCv2(1、2或4个NVIDIA Tesla P100 GPU)
● ND(1、2或4个NVIDIA Tesla P40 GPU)
NVIDIA还提到,这些相同的NVIDIA GPU云(NGC)容器可以跨Azure实例类型工作,即使GPU类型或数量不同也可以跨Azure实例类型工作。微软Azure市场里有一个预先配置的Azure虚拟机映像,包含运行NGC容器所需的所有内容(https://azuremarketplace.microsoft.com/en-us/marketplace/apps/nvidia.ngc_azure_17_11?tab=Overview ) 。
微软今天还面向普通用户推出了“Azure CycleCloud”,可用于“创建、管理、操作和优化Azure中任何规模的HPC集群工具”。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。