至顶网软件频道消息:亚马逊网络服务周三宣布全面推出适用于Windows的Amazon EC2 Elastic GPUs。目前,客户可以在us-east-1和us-east-2中使用弹性GPU。
弹性GPU附加到亚马逊弹性计算云(Amazon Elastic Compute Cloud ,EC2)实例以加速应用程序的图形性能。它们最好地适应了哪些需要小量或间歇性额外GPU能力的应用程序。
AWS云高级技术宣讲者Randall Hunt在一篇博文中写道:“您可以针对许多实例类型使用弹性GPU,您可以灵活地为应用程序选择适当的计算、内存和存储空间。
弹性GPU有四种规格:中型(1GB)、大型(2GB)、超大型(4GB)和2X超大型(8GB)。它们为使用像G3或G2这样的GPU实例类型(针对OpenGL 3.3应用程序)提供了较低成本的替代方案,最低的eg1.medium的价格只要一小时5美分。
通过将中型弹性GPU连接到t2.medium实例(每小时只需要6美分),只使用一个GPU的实例每个小时的成本将低于12美分。Hunt指出,以前,最便宜的图形工作站(G2 / 3之类)每小时的成本是76美分。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。