AWS即将推出云计算实例系列预览,使企业可以在AWS云上训练人工智能(AI)模型,其性价比与显卡比高40%。
预计该实例系列能在2021年上半年应市。AWS日前在旗下的re:Invent线上活动上宣布了该消息,AWS同时还宣布推出用于其他使用案例的计算产品,例如运行数据库和渲染视频内容等使用案例。
AWS计划推出的的AI实例,是基于英特尔公司的Gaudi 芯片,这些芯片针对训练神经网络进行了专门优化。英特尔曾斥资200亿美元收购半导体初创公司Habana Labs Ltd纳入其产品系列。AWS的实例系列最多可提供含八个Gaudi的实例,据Habana 高管Eitan Medina发布的博文称,这可以提供足够的算力以每秒12,000张照片的速度训练人工智能模型,相当于使用行业标准Resnet-50模型时达到的训练速度。
云巨头AWS将在适当的时机推出Gaudi实例。AI模型现在越来越复杂,一部分原因是由于企业机器学习举措趋于成熟,也有部分原因是因为诸如OpenAI等公司在做的研究,使大型神经网络架构成为可行。随着神经网络复杂性的增长,训练神经网络所需的算力需求也在增加,因而也推动了更有效地训练神经网络架构的需求。
这消息亦是英特尔的大胜利。芯片制造商英特尔最近几个季度将旗下中央处理器的核心聚焦领域扩展到其他领域,包括AI芯片市场。云领导者AWS采用英特尔的Gaudi芯片,预计这些芯片还具有高性价比的竞争力,这些事实都在向其他潜在客户发出强大的信号。
云巨头AWS采用Gaudi推动更广泛的策略,进而扩展旗下的云可提供的芯片选项数量。AWS还在re:Invent上宣布了开发Trainium自家AI训练处理器的消息。
AWS表示,Trainium将提供“云端训练机器学习模型的最佳性价比”。亚马逊子公司AWS并没有给出太多Trainium芯片的技术规细节。但AWS透露,Trainium适合于训练各种模型,包括用于图像分类、翻译、语音识别、自然语言处理和产品推荐等神经网络。
Trainium芯片预计将于2021年下半年提供给客户使用。
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
微软研究院发布BitDistill技术,通过三阶段优化将大型语言模型压缩至1.58位精度,在保持性能的同时实现10倍内存节省和2.65倍速度提升。该技术包括模型结构稳定化、持续预训练适应和知识蒸馏传承三个关键步骤,解决了模型量化中的性能衰减和规模化问题,为AI模型在资源受限设备上的高效部署提供了新方案。