ZDNet至顶网软件频道消息:当用户发现企业内某些应用系统故障时,多数时候第一反应就是网络出现了故障。网络管理人员通过常规的手段又不能找到证明网络正常的证据,也不能定位应用系统故障的原因,这时就需要用到网络分析类的产品,对链路及应用进行长期监控,完整还原故障数据,能够最快的分析出网络及应用的故障。
科来回溯分析系统能够透视网络流量、分析完整应用会话,从而快速判断应用故障的根本原因。以下就是通过科来回溯分析系统快速定位业务系统故障的案例。
某能源集团仓库管理系统对整个仓储环节实施全过程控制管理,仓储在企业的整个供应链中起着至关重要的作用, 但是厂区的内多个用户能够通过客户端打开仓储管理系统时能够正常登陆,但在进行查询库存量等操作时经常出现“卡死“状态。严重的影响了工作效率。
网络管理人员通过分析用户的操作方式、查看防火墙策略、查看交换机工作状态、更换出现故障的多个用户线路等多种常规方法,历时1个多月的时间,最终还是未能确定问题原因。
我们通过在用户接入交换机上部署科来网络回溯分析系统,实时抓取用户访问仓储管理系统的流量,分析可能的故障原因。
如上图,可以说明网络传输效率很好。数据传输过程数据传送也十分迅速,不存在大量丢包的问题。
如上图,我们定位到发生问题的TCP会话,发现在服务器向客户端发送完数据之后,客户端立即向服务器端发送了RST(重置)数据包,中断了TCP会话。
至此我们基本可以判断仓库管理系统故障主要是由客户端的异常中断造成的。
找到问题的根源后,我们找到了经常出现问题的几台用户PC,通过完全删除客户端程序后重新下载安装客户端的方法,彻底解决了仓库管理系统的的故障现象。
由于业务系统情况复杂,可能出现问题的节点较多,使用常规分析手段不能够快速的找到问题根源,同时增加了很多排障的时间及人力成本。但通过上述案例可以看出,该应用问题困扰了用户一个月的时间,但通过部署科来网络回溯分析系统只用了短短几分钟的时间就能够快速找到问题根源,解决了用户的燃眉之急。
好文章,需要你的鼓励
英伟达在SIGGRAPH大会上发布了全新的AI世界模型、库和机器人开发基础设施。其中最引人注目的是Cosmos Reason,这是一个70亿参数的"推理"视觉语言模型,专门用于物理AI应用和机器人。新发布的还包括Cosmos Transfer-2模型,能够从3D仿真场景加速合成数据生成,以及速度优化版本。公司还推出了神经重建库、RTX Pro Blackwell服务器和DGX Cloud云平台,旨在为机器人开发提供完整的解决方案。
清华大学团队开发出DPoser-X人体姿态AI系统,使用创新的扩散模型技术统一处理全身、手部、面部姿态建模。该系统采用混合训练策略和截断时间步调度,在8个权威测试基准上比现有方法准确度提升61%。技术可广泛应用于动画制作、体育训练、医疗康复、虚拟现实等领域,代表AI理解人类行为的重要突破。
两大企业基础设施厂商宣布产品线扩展,为客户提供更多大规模部署人工智能工作负载的选择。戴尔更新AI数据平台,新增非结构化数据引擎,并推出搭载英伟达RTX PRO 6000 Blackwell GPU的PowerEdge服务器。HPE扩展AI优化系统配置,支持自主AI和物理AI应用。两家公司均集成英伟达最新Blackwell架构GPU和AI软件套件,提供从数据处理到模型推理的完整解决方案。
Meta研究团队推出FACTORY测试系统,这是首个大规模人工验证的AI事实准确性评估基准,包含超过1万个高难度问题。测试结果显示,即使是最先进的AI系统在面对复杂事实性问题时准确率也仅约60%,远低于传统测试中的90%以上表现。该研究揭示了当前AI系统在专业知识覆盖和复杂推理能力方面的不足。