基于AI的智能体当下可谓风头正劲。最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。智能体不仅可以像聊天机器人那样回答问题,还能接受人类甚至是其他智能体委托给它们的任务。而且与AI领域的其他成果一样,智能体同样保持着迅猛的发展速度。
短短两个月前,关于智能体的新闻和产品公告还主要集中在应用程序内等传统场景之下。这类智能体的作用是在平台环境下实现个体的生产力与任务自动化。例如,可以设计一个定期扫描多份文档、总结其中信息并向最终用户推荐相应操作的个人生产力代理。以Salesforce为例,这可能意味着其产品会每季度扫描潜在客户渠道,观察是否存在新的数字营销机会并提供策略建议。这些个人生产力智能体将为希望快速完成更多工作的最终用户带来巨大助益。
虽然个人生产力智能体作用不小,但影响力或者说想象空间却相当有限。首先需要承认,这些部署在应用平台内的个人生产力智能体其实很强,能够提升现有技术投资来展示智能体的整体潜力,而且会随着时间推移而加深用户与平台之间的联系。然而,真正的业务影响力应当让企业看到明确的投资回报并为此加大资源投入,而不只是带来种种“锦上添花”的效果。遗憾的是,我认为个人生产力智能体无法达到这样的地位,具体原因有三。
同样的,个人生产力智能体虽也具有实用性,但生成式AI的生态系统仍需要提供更可量化的商业价值来证明战略投资的合理性。最近一段时间,已经出现了相关的积极势头。UiPath就通过开发企业智能体来匹配其机器人流程自动化解决方案,从而实现更为高效的业务流程。通过采用不同的治理和智能体开发方法,UiPath在构建跨企业智能体应用方面获得了更大的施展空间。
再来看其他案例。IBM等咨询公司也在重新调整其交付企业系统集成项目的方式,运用自己的企业内智能体开发体系来缩短交付周期并提高项目质量。在研究这些公司及其他致力于企业AI智能体厂商时,我们发现尽管具体技术形式不同,但其实施仍然依赖于过去40年发展而成的完善IT实践。其中的核心原则包括:
再闪重申,我并不是要贬低当前这波个人生产力智能体。它们确实效果不错,而且老实说,它们也是让决策者们适应和了解AI的合理形式。然而,当领导团队决定押注新技术时,我认为门槛还应该再高一些。
好消息是,如今越来越多的云服务商、企业和初创技术供应商都在为此积极努力,此类新型AI智能体也在各种实践场景下得到应用和发挥。总之,面对大好的形势,请各位戒骄戒躁、保持谨慎,毕竟以往因盲目冒进而折戟沉沙的企业级技术已然难计其数。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。