尽管投入大量资源,但仅有不足半数AI模型能够投入生产。为了摸清造成这种窘境的原因,Run:AI委托开展了首轮AI基础设施现状调查。本次调查面向来自十个国家的211名数据科学家、AI/机器学习/IT从业者及系统架构师,他们主要来自员工超过5000人的规模企业,但也包括部分来自初创企业和超大型跨国集团。
统计数据也证实了这一基本判断:77%的受访者表示他们的大部分AI模型从未投入过正式使用;甚至有五分之一的受访者给出了更低的答案,称全部模型中只有10%能够介入生产环境。
报告中的其他发现则给出了具体解释。例如,只有17%的AI厂商能够对昂贵的AI资源进行高效利用;22%的AI解决方案开发者表示,他们的基础设施大多处于闲置状态,这是因为超过三分之一的受访者需要手动访问GPU资源,而且硬件加速器的静态分配机制也严重限制了他们的工作效率。
AI领域已经吸纳了巨量成本:38%的受访者表示所在公司单单在AI基础设施,包括硬件、软件与云开销方面就开出了超过100万美元的年度预算;更有15%的受访者表示所在公司的年度AI基础设施投入超过1000万美元。还有74%的受访者称公司计划在短期之内增加GPU容量或AI基础设施支出。
调查发现,AI工作者们面临的最大挑战集中在数据层面。61%的受访者表示数据收集、数据清洗与治理等环节存在问题。42%的受访者强调所在公司的AI基础设施与算力水平达不到要求。除开数据与基础设施这两大核心要素,紧随其后的挑战为模型开发及训练时间过长、模型引用量过大,占受访者中的24%。
调查还强调了云计算在AI领域的作用,53%的受访者表示他们的AI应用程序及基础设施位于云端,34%受访者表示计划在未来几年向云端迁移。容器已经成为运行AI工作负载的标准基础设施选项,80%的受访者表示他们已经在某些AI工作负载中使用容器技术,49%的受访者表示他们的大部分乃至全部AI负载都运行在容器之内。在编排方面,Kubernetes一马当先、获得42%的支持率,另有16%的受访者表示计划使用这套流行的容器编排解决方案。紧随其后的是Red Hat Openshift,有13%的用户正在使用、6%的受访者有意试用。
Run:AI公司联合创始人兼CEO Omri Geller表示,“除了基础设施层面的数百万美元投入之外,对AI抱有兴趣的企业还需要再准备几百万美元招纳高水平的AI员工。但很遗憾,大部分AI模型从未被投入实际生产,意味着这些投入白白打了水漂。我们的调查显示,大量基础设施处于闲置状态、引发严重的资源浪费;数据科学家被迫手动访问GPU资源;而且云迁移之旅也仍在推进当中。总之,谁能率先把自己的模型投入生产并获得实效,谁就能在这场AI竞赛当中占据领先。”
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。