ZDNet至顶网软件频道消息:从2003年正式成立,至今科来软件已经经历了十多个春秋。过去十年,国内信息化迎来爆炸式增长,网络运维领域也随之产生了变化,在给市场注入新活力的同时,也使网络运维难度不断升级。
随着网络规模越来越大、网络中承载的业务类型越来越多样化,当用户业务体验受损时,IT运维人员往往难以判断是业务系统的问题,还是网络引起的问题,更不用说定位具体什么问题导致用户体验变差,运维人员很多时候都在忙着“救火”。如何掌握业务质量情况,如何实现网络故障快速精准定位,这些已经成为网络运维领域急需解决的问题。
影响业务系统性能的因素有哪些?
首先,缺乏对业务实际运行性能的有效监控。现有的性能监控手段主要针对的主要是应用、主机、网络设备自身的运行状态监控,这些并不能直接反应业务的实际运行性能和状态。现有的性能监控系统缺乏针对应用正在发生的实际交易的响应情况、主机的连接响应和数据传输状态、应用数据的实际网络传输性能等影响业务实际运行的性能参数进行有效的监控,很多业务性能下降和业务故障无法进行有效及时的发现。
其次,缺乏对业务整体支撑架构的了解。用户支撑业务系统的网络和应用系统的规模越来越大,越来越复杂,用户多采用多头管理,一旦出现问题,如何快速隔离故障点就变成了一个非常棘手的问题,现在一般的做法是所有相关的运行维护人员各自对自己负责的系统进行逐一排查,效率低下。
再次,缺乏以业务为核心的监控视图。用户的监控系统提供的监控视图多基于网元、主机和应用分别呈现,无法体现各种事件对关键业务系统的影响,具体来讲就是说一个事件影响了哪些业务的运行性能,影响程度如何。
最后,缺乏面向业务的主动分析能力。
科来UPM护航企业运维系统
基于以上的分析,科来业务性能管理系统意在帮助用户建立一个有效的以业务为核心的网络性能智能监控分析体系,使IT运行维护工作和业务活动紧密的结合起来,简化网络监控和分析过程,从而大大提升业务网络的运行维护能力和故障处置效率,有效减少业务故障时间。
科来UPM业务性能管理解决方案由“前端回溯分析服务器(简称‘前端’)”和“UPM分析中心(简称‘UPM中心’)”两部分组成。前端设备可分布式部署在业务系统通讯传输的各个重要汇聚节点,通过交换机端口镜像或流量分流设备采集业务通信数据;实时采集分析的性能指标参数和应用报警信息通过管理接口上报到UPM中心进行汇总分析。UPM中心部署在数据中心用于集中管理配置前端设备,集中收集前端设备采集的业务性能指标及报警信息进行汇总展现。
产品部署图
科来UPM围绕客户的业务网络,提供以业务为核心的网络支撑环境梳理、实时性能监控和快速故障定位分析功能。
科来UPM是基于网络智能分析的解决方案,以业务网络通讯智能分析为基础,独立采集分析数据,不依赖和影响其它系统。能够提供支撑业务系统的网络传输、主机服务、应用响应和交易处理的全面性能分析参数,能真正的提供业务网络集成监控分析能力。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。