作者:周庆,IBM车库创新团队的业务咨询顾问,在数据驱动业务决策管理领域有丰富的落地经验。差旅爱好者,加入IBM后以各种黑科技解决业务挑战其乐无穷。
获悉IBM Instana被Gartner评选为2022年度应用性能监控(APM)和可观测性(Observbility)魔力象限的领导者,我与我身边同事们都与有荣焉。不仅Instana实现了其领先级企业可观测性平台的愿景,对我们客户、合作伙伴以及我们服务的项目来说,都是一个具有历史意义认可的时刻。
引用Gartner评选报告所言,“应用性能监控和可观测性魔力象限的领导者,其产品与市场需求强匹配,在建立与客户基础方面是最成功的。拥有全面的产品功能组合,提供卓越的应用程序可见性,并能够与其他IT运营管理(ITOM)技术广泛集成。领导者对新兴和预期市场需求皆展示出卓越的远见和执行力,不论是创新还是客户体验上保有可持续发展记录。”
由于新冠疫情的影响,许多人际互动和商业互动都转到线上进行,但在这之前,全球许多企业就已在采用软件形式实施面向核心客户、潜在客户、合作伙伴、供应商和员工的流程。这催生了一系列创新活动,我和身边的伙伴们也见证并参与了很多客户与合作伙伴前所未有的数字化转型。我们自身也在疫情伴随下,锻炼出来一些共创工作的新方式,以后有机会跟大家分享。
说到数字化转型,我们团队中不乏资深的架构师和工程专家,每每提到要开展转型需要因此创建新的应用,或者,如果出于其他任何原因将业务关键型应用投入生产环境,总一再相告应用性能管理 (APM) 重要性毋庸置疑。原因很简单 ,APM 负责监控那些实现企业与实际最终用户所关心的功能的应用与事务。
我从决策管理学的角度来理解这件事情,APM要解决的TOP Decision是确保应用在生产中正常运行,根据出现问题的原因与情况给出最佳建议。逐层拆解,可以将这个问题拆解成多个决定因素,比如监控对象的数量、服务变动的周期、对应用性能采样的频率等。因此对企业来说,数据保真度、监控实时度、持续的自动发现,甚至成本问题都是衡量应用性能监控解决方案的因素。
随着技术行业高度活跃的创新活动,也给APM带来了一系列挑战,比如,
APM 的重要性一直毋庸置疑,然而在这样的挑战之下,传统的APM很难提供所需的可视性水平,无法确保应用的正常执行和可靠性能。也正是因为 APM 缺乏对云原生应用的可视性,催生了应用可观测性解决方案,不仅收集解决问题所需的各种数据类型,还衡量事务的性能,而这正是全面的可观测性平台的关键要素之一。
如何将可观测性策略与 APM 工具结合起来?能否从一个用例顺利过渡到另一个?能否支持所有不同的数据类型(包括开源),以提供输入并通过可观测性分析所有可用信息?

IBM Instana全自动应用性能管理解决方案,能回答上述问题。通过提供精确的APM可观察性智能融合,以首屈一指的企业级观察能力,管理复杂应用程序和软件的性能,无论它们位于何处,提供高数据保真度、实时的1秒粒度、持续的自动发现,确保从整体的角度解决应用监控的挑战。由 AI 驱动,IBM Instana利用收集到的信息自动发现异常,且持续分析应用环境,对问题提前分析给出建议。
我们创新车库团队的资深架构师李峰,专注汽车行业数字化转型,他提到,“Instana作为新一代可观测平台领导者,不仅对企业传统应用起到可观测性的效果,也为企业数字化转型达到承上启下的关键作用。不仅能够辅助运维团队提高故障发现和解决的效率,同时也为敏捷开发带来了全新模式。”这也是我们应用性能可观测项目在汽车行业中不断与客户产生共鸣之处。
最后,总结IBM Instana的高光点。专为现代架构设计,旨在监视高度动态和复杂的基于容器的微服务应用程序。跟其他产品相比,几乎没有时间投入,就能够跟踪所有应用程序请求,了解服务依赖关系并关联事件。每秒收集、处理和分析指标,在用户界面中提供结果,是目前最接近全面指标检测要求的市场领导者,而且定价模型相当有吸引力。

欢迎扫码关注IBM官方微信
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。