麦肯锡公司合伙人Bhargs Srivathsan近日在新加坡召开的会议上表示,只要运用得当,生成式AI技术有望将云迁移工作量减少30%到50%。
Srivathsan认为,“目前的进度只能说才刚刚迈出第一步。随着大语言模型(LLM)的发展成熟,将工作负载迁移至公有云的时间表将不断缩短、迁移过程效率也能随之提升。”
她建议组织先使用大语言模型对系统内的基础设施进行摸底,解析其中的短板与优势,再在工作负载转移完成后继续应用AI工具查看迁移是否切实有效。
另外,还可以利用大语言模型完成更多相关工作,例如编写架构审查委员会指南等说明材料。
这位合伙人表示,尽管不少企业才刚刚开始考虑采用AI技术,但麦肯锡所投资的企业中已经有40%在更新其IT投入。
Srivathsan认为,生成式AI与云之间属于“共生”关系。
“必须承认,如果没有公有云的普及、就不可能把生成式AI真正带入生活。而与之对应,生成式AI也能切实加快公有云迁移、并帮助用户从原有公有云中解锁脱离。”
在Srivathsan看来,生成式AI的四大核心用例分别是内容生成、客户参与、创建合成数据、以及编写代码。当然,这里的编写代码并非从零开始完成软件开发。生成式AI的编码能力主要体现在接手员工离职后无人熟悉的遗留代码,或者是将原有代码转换为新的语言形式。
她还强调,之所以说公有云比尝试内部自建模型更加靠谱,是因为企业用户往往不具备充足的GPU储备。而且市面上现成商用模型的成本也比自行训练更加低廉。
Srivathsan指出,对于身处受监管行业、掌握大量专有数据或者担心知识产权遭到侵犯的用户,还可以设置相应的护栏。
在她看来,大语言模型在未来五、六年时间内将主要运行在超大规模基础设施环境当中,直到模型发展成熟。而且跟很多人想象中不同,其实生成式AI的实现并不一定压根那么夸张的算力储备,毕竟很少有用例会对延迟提出如此严苛的要求。
也就是说,除非是特斯拉上运行的自动驾驶功能、或者负责指挥制造车间实时运行的软件,否则确实没必要把硬件堆得太满。
另外,多数情况下也没必要使用定制或大规模模型。
这位麦肯锡合伙人评论称,“很多企业都以为自己需要买辆超级跑车来送披萨。当然用不着喽,真正符合需求的模型往往没那么复杂、也没那么大。举例来说,生成客服支持脚本肯定没必要动用650亿参数的大体量模型。”
但她同时给出建议,如果开发人员正在访问自己本不该接触到的非专有模型或数据,则务必要在组织内外之间添加API网关来建立起“实时警报”机制。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。