科技的快速发展正在重塑亚太地区各行各业。到2025年,企业将面临新兴威胁和机遇并存的复杂环境。要在这个充满变化的环境中保持领先,企业必须把数字韧性、安全和创新放在首位。
云原生可观测性:数字韧性的基石
目前,云原生环境用户往往因为缺乏对基础设施和应用程序堆栈的端到端可见性,难以快速发现和解决问题,进而影响了服务的可靠性和可用性。预计到2025年,用户会更加重视云原生可观测性,以便在混合云和多云环境中实时查看和关联从基础设施到应用的各类事件和指标。这将帮助他们分析整个IT环境的数据,在问题升级为事故前及时发现异常和潜在问题。
提升应对系统中断的数字韧性
2024年,我们见证了多起区域性和全球性的重大技术中断事件,比如Crowdstrike的全球服务中断。这种中断趋势还将持续,继而促使企业制定IT策略来应对、适应以及从类似中断中恢复,具体策略包括:通过多样化IT架构来降低软件集中度和供应商锁定风险,建立备用技术栈以应对故障转移,采用多供应商方案,为操作系统和Kubernetes等关键基础设施软件提供更多选择等。
零信任安全:抵御勒索软件的防护盾
2024年,勒索软件攻击急剧增加,随着不法分子使用AI进行更复杂的攻击,这一趋势预计还将持续。勒索软件即服务(RaaS)的存在加剧了这一情况。到2025年,预计将有更多公司投资零信任安全解决方案,以检测和防止勒索软件及其他零日漏洞攻击。
安全和私密的生成式AI:负责任地推动创新
采用AI技术的公司面临众多安全挑战,包括生成式AI的隐私和数据保护问题,以及AI供应链中的漏洞。为应对这些风险,私有AI平台的采用将会增加。这些平台使企业能够完全掌控其数据,保护其运营免受未经授权的数据共享、合规性风险以及“影子AI”滥用等日益增多的威胁。
AI可观测性:优化性能并减少碳足迹
AI,尤其是大型语言模型,运行所需的大量能耗会对碳排放产生显著影响。为了优化AI工作负载的能耗并减少碳排放,企业将在未来几年采用多种策略,包括:微调和优化大型语言模型,消除其性能瓶颈,选择高能效云服务供应商,负责任地扩展AI资源。可观测性工具将有助于推动并指导这些工作。
人工智能的标准操作环境:推动效率与创新
如今,有多种选项可运行生成式AI和其他类型的AI工作负载。随着时间的推移,我们预计大多数企业会为AI用例创建一个标准操作环境。环境将包含一个高度可扩展的通用AI平台,并提供AI工作负载所需的通用模块和服务,如:精心挑选的大型语言模型(LLM)、数据隐私与安全、可观测性等。标准操作环境还确保了一致的治理、有效的工作流程和优化的资源使用,从而有助于减少碳排放。
综上,2025年及以后,注重数字韧性、安全和创新的企业将能够更好地抓住新兴机遇,从容应对数字时代的各种挑战。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。