ZDNet至顶网软件频道消息:当用户发现企业内某些应用系统故障时,多数时候第一反应就是网络出现了故障。网络管理人员通过常规的手段又不能找到证明网络正常的证据,也不能定位应用系统故障的原因,这时就需要用到网络分析类的产品,对链路及应用进行长期监控,完整还原故障数据,能够最快的分析出网络及应用的故障。
科来回溯分析系统能够透视网络流量、分析完整应用会话,从而快速判断应用故障的根本原因。以下就是通过科来回溯分析系统快速定位业务系统故障的案例。
某能源集团仓库管理系统对整个仓储环节实施全过程控制管理,仓储在企业的整个供应链中起着至关重要的作用, 但是厂区的内多个用户能够通过客户端打开仓储管理系统时能够正常登陆,但在进行查询库存量等操作时经常出现“卡死“状态。严重的影响了工作效率。
网络管理人员通过分析用户的操作方式、查看防火墙策略、查看交换机工作状态、更换出现故障的多个用户线路等多种常规方法,历时1个多月的时间,最终还是未能确定问题原因。
我们通过在用户接入交换机上部署科来网络回溯分析系统,实时抓取用户访问仓储管理系统的流量,分析可能的故障原因。
如上图,可以说明网络传输效率很好。数据传输过程数据传送也十分迅速,不存在大量丢包的问题。
如上图,我们定位到发生问题的TCP会话,发现在服务器向客户端发送完数据之后,客户端立即向服务器端发送了RST(重置)数据包,中断了TCP会话。
至此我们基本可以判断仓库管理系统故障主要是由客户端的异常中断造成的。
找到问题的根源后,我们找到了经常出现问题的几台用户PC,通过完全删除客户端程序后重新下载安装客户端的方法,彻底解决了仓库管理系统的的故障现象。
由于业务系统情况复杂,可能出现问题的节点较多,使用常规分析手段不能够快速的找到问题根源,同时增加了很多排障的时间及人力成本。但通过上述案例可以看出,该应用问题困扰了用户一个月的时间,但通过部署科来网络回溯分析系统只用了短短几分钟的时间就能够快速找到问题根源,解决了用户的燃眉之急。
好文章,需要你的鼓励
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。