微软公司的研究人员日前揭开新建的“云规模”仿真器的面纱,研究人员建该仿真器的目的是要完全消除公共云网络出现中断。
仿真器名为CrystalNet。在本周于上海举行的2017年ACM年度操作系统原理研讨会上,CrystalNet是该次活动讨论的主要议题之一。
微软移动暨网络研究团队的著名科学家主管Victor Bahl表示,CrystalNet是两年多的研发工作成果。他在博文中解释说,CrystalNet的设计信念是,在云网络出现问题前发现问题并采取主动的措施。 Bahl和他的同事接着很快就认定,测试的最好方法是建一个云网络仿真器。
Bahl 表示,“部署之前先测试,这是个老办法,但微软研究院在两年的研究里考查了各个大型云提供商记录的中断情况,我们相信,如果我们先在一个相同的网络副本上验证生产网络,就可以发现大多数潜在问题。“
CrystalNet和微软生产网络是相同的,因为CrystalNet用了和微软生产网络相同的网络拓扑、硬件、软件和配置。CrystalNet可以在虚拟机内的仿真设备上运行,并且还支持大多数常见网络设备的软件映像。
微软提供了以下的CrystalNet架构图:
诸如CrystalNet的仿真网络的真谛在于,微软的Azure工程师可以用CrystalNet测试在计划的更改和更新中出现的问题,而不是直接实施更改和更新,然后希望不会出现什么大状况。一些大的公共云供应商就是直接实施更改和更新,出大状况是经常的事。 Bahl表示,用上CrystalNet后,微软的工程师可以“降低网络出严重状况的可能性”,更新时有时会出现严重状况。
早期的结果看起来还不错。 Bahl表示,微软Azure团队已经利用CrystalNet验证了一些新的网络设计、架构更改、硬件和固件更新以及网络配置更改。微软还利用CrystalNet成功地构建和测试了旗下的云开放网络软件(Software for Open Networking in the Cloud)。云开放网络软件是一款网络交换机操作系统。
尽管CrystalNet测试取得了成功,但也有专家表示,CrystalNet可能无法防止各种各样的中断。Constellation研究公司副总裁兼首席分析师Holger Mueller表示,微软试图解决一些Azure云以前遇到的网络中断问题虽然是件好事,但要防止离线还有许多其他方面需要考虑。
Mueller表示,“在部署前进行仿真和测试是确保正常运行时间的正确方法,但测试终归只是测试。能够在本地测试并即时回滚是确保正常运行时间的关键点,但回滚功能仍然是大多数基础架构即服务提供商需要开展的一个重要的工作方面,特别是在网络基础架构更新方面。
至于这种有美好前景的新技术何时以商业软件推出,Bahl没有说。但他确实也提到,一些Azure客户已经表示有兴趣将CrystalNet用于防止自己的网络出现中断。微软在考虑将CrystalNet上架出售前极有可能会先将CrystalNet整合到Azure云里。
好文章,需要你的鼓励
IDC数据显示,Arm架构服务器出货量预计2025年将增长70%,但仅占全球总出货量的21.1%,远低于Arm公司年底达到50%市场份额的目标。大规模机架配置系统如英伟达DGX GB200 NVL72等AI处理设备推动了Arm服务器需求。2025年第一季度全球服务器市场达到创纪录的952亿美元,同比增长134.1%。IDC将全年预测上调至3660亿美元,增长44.6%。配备GPU的AI服务器预计增长46.7%,占市场价值近半。
斯坦福与哈佛研究团队通过创新的"层次贝叶斯框架",首次从理性分析角度解释了AI学习策略转换机制。研究发现AI会在"记忆型"和"理解型"两种策略间理性选择,转换规律遵循损失-复杂度权衡原理。该理论框架仅用三个参数就能准确预测AI在不同条件下的行为表现,为AI系统的可控性和可预测性提供了重要理论基础。
AI正在重塑创业公司的构建方式,这是自云计算出现以来最重大的变革。January Ventures联合创始人Jennifer Neundorfer将在TechCrunch All Stage活动中分享AI时代的新规则,涵盖从创意验证、产品开发到团队架构和市场策略的各个方面。作为专注于B2B早期投资的风投合伙人,她将为各阶段创业者提供关键洞察。
这项研究汇集了来自斯坦福大学、苏黎世联邦理工学院、隆德大学、加州大学旧金山分校等多所世界顶尖学府的11位医学专家,共同构建了医学AI领域的首个多模态情境学习评估标准。