
随着2023年的帷幕徐徐落下,IT界正以乐观且谨慎的态度展望新的一年。其中谨慎是因为持续低迷的整体经济环境,而乐观的底气则来自生成式AI服务的横空出世。
继20世纪90年代文字处理与电子表格软件的爆发式增长以来,生成式AI(简称GenAI)已经成为知识工作领域又一波重大生产力驱动因素。根据麦肯锡全球研究院的数据,在提升客户运营、销售与营销以及软件工程方法,生成式AI每年有望给全球经济带来高达4.4万亿美元的价值增量。
这种谨慎乐观的情绪来自IT领导者对企业数据中心进行一体化改造,从而适应生成式AI及其他数据密集型工作负载的宝贵机遇。这无疑将是一项复杂的工作,但只要执行得当,也完全能够帮助组织提高应用程序性能、提高运营效率,同时控制成本。
我们当然没有预测未来的魔力,毕竟当初没人想得到生成式AI能够让这项技术在普罗大众当中普及得如此迅速。但这就是事实,所以无论是否准确,我们都决不可放弃对前景的推衍。
话不多说,下面来看2024年可能出现的IT管理趋势变化。
生成式AI推动工作负载分配决策
生成式AI能够缩短知识工作者每天完成工作的时间,从而彻底改变各个行业。根据戴尔科技今年早些时候开展的生成式AI脉搏调查(Generative AI Pulse Survey),52%的IT部门出于这一考量而构建或已经部署了生成式AI解决方案。
到2024年,生成式AI将加速工作负载的分配流程,组织将考虑如何以及应在何处运行其生成式AI应用,从而发挥底层大语言模型(LLM)的力量。也有一部分IT决策者将选择使用公共服务。
其他决策者则倾向于在本地设施内运行开源大语言模型,借此获取控制权,并得以利用特定领域实现、服务器集群以及合作伙伴提供的其他可靠基础设施来灵活调整工作负载规模。
通过这种方式将AI引入数据设施,将帮助组织制定起更强大的安全策略和访问政策,建立起能够降低声誉风险并增强成本效益的护栏。
多云管理更趋无缝化
出于对灵活性的需求,将有更多组织进一步从运营环境中抽象出软件功能,以便在他们选定的位置上运行工作负载。
这要求将以往运行在本地设施上的部分存储选项转移到公有云中,借此确保IT人员在管理环境时拥有更好的数据移动性与一致性。
此外,还应保证开发人员能够在本地访问到自己熟悉和乐于使用的云服务。例如,组织可能会建立自定义生成式AI聊天机器人,随时为开发者提供业务信息支持。
将这些方法汇总起来,就是当前这波努力将多云环境合并为可以无缝管理的统一系统的广泛趋势。这意味着整个基础设施资产都将被视为单一实体,从而提供更高的运营效率与商业价值。
边缘运营同样趋于合并
长久以来,支持边缘环境的基础设施一直高度分散。现如今,组织希望将这些解决方案合并起来,这样才能切实降低延迟,让整个应用体系都能保持近实时的运行性能。
到2024年,将有更多组织采用边缘运营方法,借此简化、优化且安全地跨复杂多云资产进行部署,最终获得更好的正常运行时间和服务质量。
这将加速零售(例如智能货架)、医疗保健、汽车、农业、能源及其他各个领域的创新步伐。此外,也将有更多组织探索如何将生成式AI应用扩展至边缘场景以孕育出更大的商业价值。
“即服务”随时为您服务
大多数IT员工对于公有云和当日达服务都赞不绝口,这二者都以敏捷、快速的服务体验为核心卖点。然而,大多数组织也厌倦了争论到底该用哪家厂商的云服务,以及由公有云服务带来的难以预测的成本波动。
到2024年,将有更多组织继续维持相同的基础设施服务即用即付订阅模式,但转而由自己选定的数据中心或托管中心负责交付。
此类“即服务”解决方案有效平衡了灵活性与控制力,确保IT领导者只需要为业务运营的实际开销付费。这将有助于遏制由资源密集型工作负载(例如生成式AI和高性能计算类应用)相关的成本上升,同时也让IT部门得以更好地控制计算与存储资源的消耗方式。
多云设计将不断演进
多年以来,组织已经亲眼见证自己的应用程序正在根据性能、延迟、安全性、数据可移植性甚至是其他一些突发奇想式的要求而被分布在多个运营位置。
因此,大多数IT组织在本地、公有云与私有云、托管中心以及边缘位置上运行应用程序,这也构成了事实上的多云资产。根据Enterprise Strategy Group于2023年5月发布的《通过优级工作负载释放多云之力》报告,这种位置层面的差异将愈发凸显,87%的组织预计其应用环境将在未来两年内更加趋于分散。
到2024年,将有更多IT领导者在设计层面考虑多云布局,或有意通过架构提高应用程序的性能和运营效率。这种多云体系也将有助于满足监管要求、控制和保护资产并优化运营成本。
此外,考虑到所创建的生成式AI应用程序包含大量数据,这波浪潮也将给IT领导者在设计基础设施时的思路产生巨大影响,同时影响到人们在构建和训练大语言模型时的引导倾向。
关键要点
大家可能已经注意到,贯穿这些趋势的主线就是生成式AI。事实上,这项2023年最具颠覆性的技术力量,也同样将在2024年成为最热门的工作负载类型。
IT领导者还将做出一系列关键决策,决定他们要运行哪些生成式AI应用程序,以及是否要在内部、外部或跨多个位置分布式运行。
这自然需要认真考虑计算和存储需求,以及工作负载的部署和运行架构。IT基础设施的多云设计方法则为此提供一条更智能、更负责任的实现路径。此外,值得依赖的合作伙伴将成为这段旅程上的重要助力和向导。
这已经不是胡乱猜测,而是有理有据的前瞻性判断。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。