基于AI的智能体当下可谓风头正劲。最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。智能体不仅可以像聊天机器人那样回答问题,还能接受人类甚至是其他智能体委托给它们的任务。而且与AI领域的其他成果一样,智能体同样保持着迅猛的发展速度。
短短两个月前,关于智能体的新闻和产品公告还主要集中在应用程序内等传统场景之下。这类智能体的作用是在平台环境下实现个体的生产力与任务自动化。例如,可以设计一个定期扫描多份文档、总结其中信息并向最终用户推荐相应操作的个人生产力代理。以Salesforce为例,这可能意味着其产品会每季度扫描潜在客户渠道,观察是否存在新的数字营销机会并提供策略建议。这些个人生产力智能体将为希望快速完成更多工作的最终用户带来巨大助益。
虽然个人生产力智能体作用不小,但影响力或者说想象空间却相当有限。首先需要承认,这些部署在应用平台内的个人生产力智能体其实很强,能够提升现有技术投资来展示智能体的整体潜力,而且会随着时间推移而加深用户与平台之间的联系。然而,真正的业务影响力应当让企业看到明确的投资回报并为此加大资源投入,而不只是带来种种“锦上添花”的效果。遗憾的是,我认为个人生产力智能体无法达到这样的地位,具体原因有三。
同样的,个人生产力智能体虽也具有实用性,但生成式AI的生态系统仍需要提供更可量化的商业价值来证明战略投资的合理性。最近一段时间,已经出现了相关的积极势头。UiPath就通过开发企业智能体来匹配其机器人流程自动化解决方案,从而实现更为高效的业务流程。通过采用不同的治理和智能体开发方法,UiPath在构建跨企业智能体应用方面获得了更大的施展空间。
再来看其他案例。IBM等咨询公司也在重新调整其交付企业系统集成项目的方式,运用自己的企业内智能体开发体系来缩短交付周期并提高项目质量。在研究这些公司及其他致力于企业AI智能体厂商时,我们发现尽管具体技术形式不同,但其实施仍然依赖于过去40年发展而成的完善IT实践。其中的核心原则包括:
再闪重申,我并不是要贬低当前这波个人生产力智能体。它们确实效果不错,而且老实说,它们也是让决策者们适应和了解AI的合理形式。然而,当领导团队决定押注新技术时,我认为门槛还应该再高一些。
好消息是,如今越来越多的云服务商、企业和初创技术供应商都在为此积极努力,此类新型AI智能体也在各种实践场景下得到应用和发挥。总之,面对大好的形势,请各位戒骄戒躁、保持谨慎,毕竟以往因盲目冒进而折戟沉沙的企业级技术已然难计其数。
好文章,需要你的鼓励
全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek
阿里巴巴团队推出DeepPHY,这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试,研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类,成功率普遍不足30%。更关键的是,AI模型虽能准确描述物理现象,却无法将描述性知识转化为有效控制行为,暴露了当前AI技术在动态物理环境中的根本缺陷。
GitHub CEO声称AI将承担所有编程工作,但现实中AI编程工具实际上降低了程序员的生产效率。回顾编程语言发展史,从Grace Hopper的高级语言到Java等技术,每次重大突破都曾因资源限制和固有思维遭到质疑,但最终都证明了抽象化的价值。当前AI编程工具面临命名误导、过度炒作和资源限制三重困扰,但随着技术进步,AI将有助于消除思想与结果之间的障碍。
AgiBot团队联合新加坡国立大学等机构开发出Genie Envisioner机器人操作统一平台,首次将视频生成技术应用于机器人控制。该系统通过100万个操作视频学习,让机器人能够预测行动结果并制定策略,在多个复杂任务上表现优异,仅需1小时数据即可适应新平台,为通用机器人智能开辟全新路径。