麦肯锡公司合伙人Bhargs Srivathsan近日在新加坡召开的会议上表示,只要运用得当,生成式AI技术有望将云迁移工作量减少30%到50%。
Srivathsan认为,“目前的进度只能说才刚刚迈出第一步。随着大语言模型(LLM)的发展成熟,将工作负载迁移至公有云的时间表将不断缩短、迁移过程效率也能随之提升。”
她建议组织先使用大语言模型对系统内的基础设施进行摸底,解析其中的短板与优势,再在工作负载转移完成后继续应用AI工具查看迁移是否切实有效。
另外,还可以利用大语言模型完成更多相关工作,例如编写架构审查委员会指南等说明材料。
这位合伙人表示,尽管不少企业才刚刚开始考虑采用AI技术,但麦肯锡所投资的企业中已经有40%在更新其IT投入。
Srivathsan认为,生成式AI与云之间属于“共生”关系。
“必须承认,如果没有公有云的普及、就不可能把生成式AI真正带入生活。而与之对应,生成式AI也能切实加快公有云迁移、并帮助用户从原有公有云中解锁脱离。”
在Srivathsan看来,生成式AI的四大核心用例分别是内容生成、客户参与、创建合成数据、以及编写代码。当然,这里的编写代码并非从零开始完成软件开发。生成式AI的编码能力主要体现在接手员工离职后无人熟悉的遗留代码,或者是将原有代码转换为新的语言形式。
她还强调,之所以说公有云比尝试内部自建模型更加靠谱,是因为企业用户往往不具备充足的GPU储备。而且市面上现成商用模型的成本也比自行训练更加低廉。
Srivathsan指出,对于身处受监管行业、掌握大量专有数据或者担心知识产权遭到侵犯的用户,还可以设置相应的护栏。
在她看来,大语言模型在未来五、六年时间内将主要运行在超大规模基础设施环境当中,直到模型发展成熟。而且跟很多人想象中不同,其实生成式AI的实现并不一定压根那么夸张的算力储备,毕竟很少有用例会对延迟提出如此严苛的要求。
也就是说,除非是特斯拉上运行的自动驾驶功能、或者负责指挥制造车间实时运行的软件,否则确实没必要把硬件堆得太满。
另外,多数情况下也没必要使用定制或大规模模型。
这位麦肯锡合伙人评论称,“很多企业都以为自己需要买辆超级跑车来送披萨。当然用不着喽,真正符合需求的模型往往没那么复杂、也没那么大。举例来说,生成客服支持脚本肯定没必要动用650亿参数的大体量模型。”
但她同时给出建议,如果开发人员正在访问自己本不该接触到的非专有模型或数据,则务必要在组织内外之间添加API网关来建立起“实时警报”机制。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。