微软Azure开发Tardigrade项目冀提高Azure服务器的耐用性

微软正开展多方面的工作以提高旗下Azure数据中心的弹性。Azure的首席技术官Mark Russinovich在上周的微软构建（Build）大会2019上做了题为“Inside Azure datacenter architecture”的演讲，他概述了微软关注的一些具体可靠性领域。

微软正开展多方面的工作以提高旗下Azure数据中心的弹性。Azure的首席技术官Mark Russinovich在上周的微软构建（Build）大会2019上做了题为“Inside Azure datacenter architecture”（Azure数据中心架构一瞥https://www.youtube.com/watch?v=S2zguwKvlQk）的演讲，他概述了微软关注的一些具体可靠性领域。

Russinovich描述的其中一项工作是“Tardigrade项目”。Russinovich向与会者解释了Tardigrade的意思，Tardigrade（一种微动物，也被称为“水熊”或“苔藓猪仔” https://en.wikipedia.org/wiki/Tardigrade）是目前发现的生命力最强的生物之一。Tardigrade可以在外太空和极端温度下存活。

微软的目标是利用Tardigrade项目令云应用程序能够在平台故障发生时保存下来。

Russinovich表示，“我们希望我们的服务器像Tardigrade一样顽强”糟糕的事情出现时，我们不必重启虚拟机（VM）。Tardigrade可以“令VM冻结在RAM内存里，VM的状态得以保留下来”。如此操作系统可以在新服务器上恢复。

Russinovich没有提供关于何时推出这项技术的任何细节，但他在构建大会上的演讲里演示了Tardigrade的工作过程。

更新（5月14日）：网上可以找到一个名为Tardigrade的微软研究项目。这份2015年5月的研究报告（https://www.microsoft.com/en-us/research/publication/tardigrade-leveraging-lightweight-virtual-machines-to-easily-and-efficiently-construct-fault-tolerant-services/）详细描述了微软对于Tardigrade的观点，即“利用轻量级虚拟机轻松高效地构建容错服务”。微软在5月14日晚些时候联系了笔者，称两个Tardigrades没有关系。

微软研究院的 Tardigrade研究论文摘要：

“Tardigrade是个将现存的、未经修改的二进制文件部署为容错服务的系统。Tardigrade在多台机器上复制服务，因而即使其中一些机器出现故障时也能继续运行。而Tardigrade的服务状态保持同步，因此客户端看到强烈一致的结果。“

微软研究人员概述的Tardigrade使用“轻量级虚拟机的进程沙盒，因此它的外部依赖关系被完全封装，令其可以跨机器迁移。为了让未经修改的二进制文件能在这样的沙箱中运行，沙箱还包含了提供预期所需API的库操作系统。“

是个库操作系统吗？是的，似乎Tardigrade其实是源于微软做的与“Drawbridge”相关的工作。

Drawbridge曾是微软研究院的一个项目，旨在为应用程序沙盒提供一种新的虚拟化形式。微软研究人员对其的描述是，Drawbridge依赖于Picoprocesses（一个具有最小内核的基于进程的隔离容器）和一个库操作系统，或者说是个重构为能在应用程序里作为一组库运行的操作系统。Microsoft靠着Drawbridge概念将SQL Server引入了Linux及将Windows子系统Linux引入了Windows 10。

微软发言人表示，微软研究院的Tardigrade与Azure项目的Tardigrade没有任何关系，尽管二者名字相同（而且对于笔者而言潜在的焦点听起来也类似）。该发言人表示，Azure 的Tardigrade项目是一项全新的计划。

Russinovich上周接受Geekwire时表示，微软也希望通过在全球推出更多可用区域（Availability Zones）来提高旗下数据中心的可靠性。可用区域旨在帮助保护客户免受数据中心层次故障的影响。这些区域位于Azure区域内，提供独立的电源、网络和冷却系统。启用的Azure区域里至少有三个分隔的区域位置。

虽然微软官员经常声称微软在全球拥有的云区域比任何云提供商都多，但支持可用区域的Azure区域却相对较少。AWS在这一块则将“区域”定义AWS运营可用区域群集的地理位置。 AWS目前在21个地区拥有64个可用区域。

来源：ZDNet

0赞

好文章，需要你的鼓励

微软Azure开发Tardigrade项目 冀提高Azure服务器的耐用性

来源：ZDNet

2019

05/16

11:28

分享

点赞

你的下一位同事可能是具身机器人

GitHub CEO离任，微软直接接管代码托管平台

AI承诺的机遇掩盖了有序替代的现实

负责任的AI始于负责任的领导力

告别SaaS：智能体平台公司时代已来

英伟达发布Cosmos世界模型及机器人基础设施

戴尔和HPE基于英伟达Blackwell架构扩展AI基础设施产品线

Reddit封锁互联网档案馆阻止AI公司数据抓取

2025年软件供应链面临的最大挑战

Ocean推出Gmail生产力管理新应用

Pure Storage声称其闪存在功耗和碳排放方面超越固态硬盘

Nvidia在SIGGRAPH 2025发布下一代智能体AI和推理机器人模型

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

服务器基础知识全解（终极版）

思科希望拥有人工智能数据中心后端基础设施

微软开源旗下的Phi-4小型语言模型

微软打造的迷你AI PC问世

微软计划在2025财年斥资800亿美元建设人工智能数据中心

让实时互动和AI，同频共振

热点丨苹果造芯 博通助力!首款AI芯片Baltra2026年量产

微软发布主要使用合成数据训练的Phi-4语言模型

微软预览新型节水数据中心设计

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

微软Azure开发Tardigrade项目冀提高Azure服务器的耐用性

热点丨苹果造芯博通助力!首款AI芯片Baltra2026年量产