微软上个月发布了一份名为《未来工作新形态》(New Future of Work)的公告 ,其中强调用户应当关注的不是AI会如何影响工作,而是明确表达希望怎样在工作中运用AI技术。
如果这则公告将转化成现实,那么未来的工作形态将从僵化组合逐步发展为灵活选择,最终全面重塑我们的日常业务流程及体验。
不过单从报告内容来看,这更像是微软在解释对OpenAI砸下的130亿美元有望创造何种价值,而不是AI技术对工作环境深远影响的具体分析。
没错,公告承认目前的AI仍存在不少问题。虽然它能加快某些工作的速度(例如,据称AI技术能够帮助写作任务提交37%),但同时也会拉低不少工作的准确性。有研究援引相关报告发现,波士顿咨询集团的专家们在使用大语言模型之后,准确性反而下降了19%,这样的结果对于全球顶尖咨询巨头之一来说肯定不是好消息。
而从微软这次的公告来看,软件巨头信心满满地表示,微软造成的问题(或者说是通过资助OpenAI而引发的新问题)就只有微软自己才能解决。
在报告后文中,微软又抓住机会宣传了一波大模型不准确问题的解决方案:Copilot。无论大家是否认可,Copilot都有能力、也有意愿挺身而出,迎接挑战。
微软援引一项内部研究表示,与其他大模型一样,“用户发现Copilot切实减少了日常工作量。”微软还强调,Copilot还拥有另一大优越特性,即“多数情况下不会影响质量水平。”当然,“不影响质量水平”肯定算不上积极的论断,但这至少是个非负面的起点,代表着Copilot开始让更多人接纳AI。
根据微软的解释,“对Copilot企业用户的一项调查也显示,受众普遍获得了可感知的时间节约效果。”注意这里的表述是“可感知的”。此外,“68%的受访者认为Copilot实际上提高了自己的工作质量。”
但这些数字和论断,真的可靠吗?
自从本月早些时候发布Copilot Pro(由OpenAI驱动的大模型机器人高级版本,目前已被集成进Microsoft 365当中)以来,已经有不少用户给出负面评价,称其效果不佳、价格过高,最多只会挑错、并不能实际解决问题。
微软还一直试图将Copilot推广为一款编码产品,宣称对GitHub Copilot用户的研究发现,其开发速度都有相应提高。调查最后强调,开发人员“赞赏AI编程辅助功能,并将其视为一项积极的资产。”
可从更多其他数据来看,AI也在让代码变得更加复杂。以技术媒体DevClass的报道为例,像GitHub Copilot这样的AI编码工具更倾向于添加新代码,而非删除或更新现有代码。这明显会导致现有应用程序变得愈发臃肿、复杂。
微软在公告中还引用一项研究,称大语言模型能够为职业经验不足的员工提供重大帮助。但在短短几页之后,报告就提到哪怕是涉及微小语义区别的提示词偏差,也可能导致完全不同的结果。难道说新手能够把握如此微妙的需求差异?显然不可能。
微软方面写道,经验不足的员工的确很难给出能返回准确信息的提示词,但不必担心,“Copilot Lab项目将通过一系列建议帮助用户掌握技巧,学会如何高效与大语言模型开展交互。”
也就是说,要指望用ChatGPT生成足够精确的提示词,再借此让同样基于GPT模型的Copilot生成良好结果——这怎么听都不太靠谱。
微软的这份报告发布于上个月,当时软件巨头才刚刚把Copilot硬塞进Microsoft 365全家桶当中。更重要的是,此举确实让微软成为继苹果之后历史上第二家市值达到3万亿美元的企业。所以不管实际效果如何,受众的确对这家软件巨头疯狂推广AI方案的措施相当买账。
回顾这份报告,微软大力推动AI投资看来是物有所值。毕竟130亿美元代表着一笔巨大的沉没成本,微软不可能坐视其打了水漂。但这同时也引发了监管层面的关注,所以前景究竟如何暂时还难以判断。
美国联邦贸易委员会上周宣布,正在调查微软对OpenAI以及其他大型科技企业的AI投资活动。欧盟委员会及英国竞争与市场管理局也各自启动了调查,关注微软与OpenAI之间的合作是否存在反竞争嫌疑。
微软?反竞争?听起来多么耳熟。
这家软件巨头在报道最后指出,“未来的工作将表现为丰富的选择,而非僵化组合”——而在这波巨变当中,AI必将成为塑造工作面貌的核心力量。
就这个问题,微软提到“AI领域各大主要参与方已经表达了自己对于未来工作形态的判断”,而后列出OpenAI章程与微软Copilot发展愿景作为自己的答案。
然而,这份报告并没有深入探讨恶意人士利用AI污染搜索结果、毒害AI语料库的问题,更没有考虑像OpenAI这样的组织疯狂从互联网上抓取数据、免费训练自家模型的行为,到底会对创意产业造成怎样的深远影响。
所以从这份公告来看,微软只在乎自家AI能不能广泛普及,对于实际质量倒是漠不关心。
所以大家在未来的工作场所中当然会拥有更加丰富灵活的选项。而丰富和灵活的定义与边界,将会由微软和OpenAI来划定。没错,商业的游戏就是这么玩的。
好文章,需要你的鼓励
在AI智能体的发展中,记忆能力成为区分不同类型的关键因素。专家将AI智能体分为七类:简单反射、基于模型反射、目标导向、效用导向、学习型、多智能体系统和层次化智能体。有状态的智能体具备数据记忆能力,能提供持续上下文,而无状态系统每次都重新开始。未来AI需要实现实时记忆访问,将存储与计算集成在同一位置,从而创造出具备人类般记忆能力的数字孪生系统。
香港理工大学联合多所高校开发的Mol-R1框架,首次实现了AI在分子发现中的透明推理。该系统通过PRID方法学习专家推理模式,配合MoIA迭代训练策略,不仅能准确生成分子结构,还能展示完整思考过程。相比现有模型,Mol-R1推理更简洁高效,为药物研发等领域的AI应用提供了重要的安全保障。
OpenAI首席执行官阿尔特曼表示,公司计划在不久的将来投入数万亿美元用于AI基础设施建设,包括数据中心建设等。他正在设计新型金融工具来筹集资金。阿尔特曼认为当前AI投资存在过度兴奋现象,类似于90年代互联网泡沫,但AI技术本身是真实且重要的。他承认GPT-5发布存在问题,并表示OpenAI未来可能会上市。
蚂蚁集团AWorld团队发表突破性研究,创建动态多智能体协作系统解决AI稳定性难题。研究灵感来源于船舶导航,通过执行智能体和守护智能体的协作机制,在GAIA测试中准确率达67.89%,稳定性提升17.3%,荣登开源项目排行榜第一名。该系统为构建可靠智能系统开辟新路径,具有广阔应用前景。