微软公司的研究人员日前揭开新建的“云规模”仿真器的面纱,研究人员建该仿真器的目的是要完全消除公共云网络出现中断。
仿真器名为CrystalNet。在本周于上海举行的2017年ACM年度操作系统原理研讨会上,CrystalNet是该次活动讨论的主要议题之一。
微软移动暨网络研究团队的著名科学家主管Victor Bahl表示,CrystalNet是两年多的研发工作成果。他在博文中解释说,CrystalNet的设计信念是,在云网络出现问题前发现问题并采取主动的措施。 Bahl和他的同事接着很快就认定,测试的最好方法是建一个云网络仿真器。
Bahl 表示,“部署之前先测试,这是个老办法,但微软研究院在两年的研究里考查了各个大型云提供商记录的中断情况,我们相信,如果我们先在一个相同的网络副本上验证生产网络,就可以发现大多数潜在问题。“
CrystalNet和微软生产网络是相同的,因为CrystalNet用了和微软生产网络相同的网络拓扑、硬件、软件和配置。CrystalNet可以在虚拟机内的仿真设备上运行,并且还支持大多数常见网络设备的软件映像。
微软提供了以下的CrystalNet架构图:
诸如CrystalNet的仿真网络的真谛在于,微软的Azure工程师可以用CrystalNet测试在计划的更改和更新中出现的问题,而不是直接实施更改和更新,然后希望不会出现什么大状况。一些大的公共云供应商就是直接实施更改和更新,出大状况是经常的事。 Bahl表示,用上CrystalNet后,微软的工程师可以“降低网络出严重状况的可能性”,更新时有时会出现严重状况。
早期的结果看起来还不错。 Bahl表示,微软Azure团队已经利用CrystalNet验证了一些新的网络设计、架构更改、硬件和固件更新以及网络配置更改。微软还利用CrystalNet成功地构建和测试了旗下的云开放网络软件(Software for Open Networking in the Cloud)。云开放网络软件是一款网络交换机操作系统。
尽管CrystalNet测试取得了成功,但也有专家表示,CrystalNet可能无法防止各种各样的中断。Constellation研究公司副总裁兼首席分析师Holger Mueller表示,微软试图解决一些Azure云以前遇到的网络中断问题虽然是件好事,但要防止离线还有许多其他方面需要考虑。
Mueller表示,“在部署前进行仿真和测试是确保正常运行时间的正确方法,但测试终归只是测试。能够在本地测试并即时回滚是确保正常运行时间的关键点,但回滚功能仍然是大多数基础架构即服务提供商需要开展的一个重要的工作方面,特别是在网络基础架构更新方面。
至于这种有美好前景的新技术何时以商业软件推出,Bahl没有说。但他确实也提到,一些Azure客户已经表示有兴趣将CrystalNet用于防止自己的网络出现中断。微软在考虑将CrystalNet上架出售前极有可能会先将CrystalNet整合到Azure云里。
好文章,需要你的鼓励
在基于Chiplet的架构中,可观测性正成为系统设计的关键缺失环节。多位半导体行业专家指出,AI可从硅层遥测数据中挖掘价值,但前提是架构须提供一致的检测手段、近传感器数据压缩及可编程采集能力。专家们强调,多供应商Chiplet生态系统需要标准化、安全的遥测模式,以实现跨芯片、封装和互联域的故障定位,同时保护敏感运营数据。目前,AI在遥测分析阶段已展现出显著价值,但可观测性的扩展本质上仍是架构问题。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
生命科学企业在全渠道战略和AI平台上投入巨大,但成效往往不尽如人意。问题根源不在于技术本身,而在于组织架构、数据治理和工作方式未能同步演进。许多转型项目止步于试点阶段,原因是各部门数据孤立、职责不清。要实现从传统CRM向智能互动的真正转型,企业需优先建立统一的数据基础和跨团队协作机制,并将AI能力嵌入日常工作流程,而非将其视为独立模块。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。