微软公司的研究人员日前揭开新建的“云规模”仿真器的面纱,研究人员建该仿真器的目的是要完全消除公共云网络出现中断。
仿真器名为CrystalNet。在本周于上海举行的2017年ACM年度操作系统原理研讨会上,CrystalNet是该次活动讨论的主要议题之一。
微软移动暨网络研究团队的著名科学家主管Victor Bahl表示,CrystalNet是两年多的研发工作成果。他在博文中解释说,CrystalNet的设计信念是,在云网络出现问题前发现问题并采取主动的措施。 Bahl和他的同事接着很快就认定,测试的最好方法是建一个云网络仿真器。
Bahl 表示,“部署之前先测试,这是个老办法,但微软研究院在两年的研究里考查了各个大型云提供商记录的中断情况,我们相信,如果我们先在一个相同的网络副本上验证生产网络,就可以发现大多数潜在问题。“
CrystalNet和微软生产网络是相同的,因为CrystalNet用了和微软生产网络相同的网络拓扑、硬件、软件和配置。CrystalNet可以在虚拟机内的仿真设备上运行,并且还支持大多数常见网络设备的软件映像。
微软提供了以下的CrystalNet架构图:
诸如CrystalNet的仿真网络的真谛在于,微软的Azure工程师可以用CrystalNet测试在计划的更改和更新中出现的问题,而不是直接实施更改和更新,然后希望不会出现什么大状况。一些大的公共云供应商就是直接实施更改和更新,出大状况是经常的事。 Bahl表示,用上CrystalNet后,微软的工程师可以“降低网络出严重状况的可能性”,更新时有时会出现严重状况。
早期的结果看起来还不错。 Bahl表示,微软Azure团队已经利用CrystalNet验证了一些新的网络设计、架构更改、硬件和固件更新以及网络配置更改。微软还利用CrystalNet成功地构建和测试了旗下的云开放网络软件(Software for Open Networking in the Cloud)。云开放网络软件是一款网络交换机操作系统。
尽管CrystalNet测试取得了成功,但也有专家表示,CrystalNet可能无法防止各种各样的中断。Constellation研究公司副总裁兼首席分析师Holger Mueller表示,微软试图解决一些Azure云以前遇到的网络中断问题虽然是件好事,但要防止离线还有许多其他方面需要考虑。
Mueller表示,“在部署前进行仿真和测试是确保正常运行时间的正确方法,但测试终归只是测试。能够在本地测试并即时回滚是确保正常运行时间的关键点,但回滚功能仍然是大多数基础架构即服务提供商需要开展的一个重要的工作方面,特别是在网络基础架构更新方面。
至于这种有美好前景的新技术何时以商业软件推出,Bahl没有说。但他确实也提到,一些Azure客户已经表示有兴趣将CrystalNet用于防止自己的网络出现中断。微软在考虑将CrystalNet上架出售前极有可能会先将CrystalNet整合到Azure云里。
好文章,需要你的鼓励
Python通过PEP 810提案正式引入惰性导入功能,允许程序延迟加载导入库直到实际需要时才执行,而非在启动时全部加载。该提案由指导委员会成员Pablo Salgado于10月3日提出并于11月3日获批。新功能采用选择性加入方式,保持向后兼容性的同时解决了社区长期面临的启动时间过长问题,标准化了当前分散的自定义解决方案。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
Valve最新Steam硬件软件调查显示,Linux用户占比达到3.05%,较上月增长0.37个百分点,相比去年同期增长约50%。游戏网站Boiling Steam分析显示,Windows游戏在Linux平台兼容性达历史最高水平,近90%的Windows游戏能在Linux上启动运行,仅约10%游戏无法启动。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。