ZD至顶网软件频道消息: 微软正在在全公司范围内推进各项与机器人相关的项目,有一些是公开的,另一些则不是。
在二十一世纪初,微软在机器人技术上下了重注。在那个十年之中,这家公司似乎已经放弃了机器人领域。
但是现在可能是微软打算在多个领域回到机器人世界的一年。
在微软的创始人比尔.盖茨仍然参与公司的日常业务时, 机器人被认为是微软的下一个大事件。微软为从Lego机器人到工业级机器人在内的一切打造了一个编程模型和框架。然而,这款产品——“Microsoft Robotics Studio”——从来没有走出学术和爱好者社区,该公司在这个领域内的勃勃雄心也凋谢了。
截至2017年。在这些日子里,微软现在在机器人方面的工作中的一大部分显然都放在了微软研究院(MSR)——特别是在AI +研究(AI + R)集团下执行副总裁Harry Shum手中。 (我在这里说“显然”是因为微软的官员们拒绝回答我对该公司的机器人计划的任何问题。)Shum因其在计算机视觉和图形领域的工作而闻名,他从卡内基梅隆大学获得了机器人专业的博士学位。
微软打造机器人框架和服务的工作推出了一大批微软自己的和第三方的聊天机器人,这些机器人遍布Skype和其他的非微软消息服务,这是这个团队的公共使命之一。但是还发生了很多没有公开的事情。
在2016年6月,微软组建了一个名为空间信息技术和机器人(AIR)的研究团队,负责“建立安全的智能和自主飞行机器人,并推动能够对我们的社会产生积极影响的应用程序。”也就是“飞行机器人”。根据微软自己在其研究院网站上的描述,AIR集团建立在微软在机器智能和机器人技术方面的研究之上,旨在协助从微型UAV(无人飞行器/无人机)到商用喷气式客机在内的一切。
该网站表示,“这种算法和系统的结合支持各类飞机,如四旋翼飞机、腾飞滑翔机、小型飞机和商业飞机,应用场景包括精准农业监测、病原体监测、天气传感、实现数字连接等。”
值得回顾的是,在这些日子里,微软研究院的目标不仅仅是为了研究而研究,而是为了有朝一日能够以某种方式商业化而进行研究。最近微软为微软研究院的战略原型设计团队招聘的工作人员要求具备“杰出的SDE(软件开发工程师),能够胜任真正完成自主机器人部署这一目标下的各项工作。”
微软的Office Products Group and Cloud & Enterprise Group似乎也有另一项与机器人相关的工作。考虑到微软改进业务生产力和流程的使命,在这种环境中会有和机器人有关的工作并不奇怪。
在2015年,微软的官员们开始谈论该公司之前隐形的Ambient Computing and Robotics团队做的一些工作。开发基于“环境通信”概念的GigJam Office 365服务是这个团队的工作之一。微软推迟了计划在去年全面推出的GigJam,GigJam旨在业务应用、软件即服务应用和其他服务推动跨平台的信息共享。
团队的另一部分更专注于特定的垂直领域的计算机视觉和自主机器人,例如建筑、酒店、零售商店等。这些自主和半自主的机电设备不是星球大战里那些大名鼎鼎的机器人;它们是工业机器人,像“纽约时报”最近描述的那样,这是中国工厂自动化繁荣的关键。
从微软最近发布的一则招聘信息(现在被列为AI+ Research的职位)能够看出更多端倪:
“Ambient Computing & Robotics团队正在为计算机视觉、基于AI的认知和自主机电设备遍布工作场所的时代创造应用。我们正在使用这种融合来改造建筑工地、物流场、行李处理区、医院走廊、工厂、餐馆、农场等场合的物理工作。这项工作的一个关键在于如何利用有价值的有形资产,使其在组织内部和整个经济体内实现最佳的按需分配。”
另一个相关的Ambient Computing招聘信息谈到了微软正在这个领域构建“一套应用程序”。下面内容摘自招聘信息:
“我们正在构建一套针对物理世界设计的新应用程序,它由云服务构成,将数字设备和传感器连接在一起,采用最先进的学习算法来识别用户、活动并协助用户协调任务,处理现实世界中的紧急情况。”
“你是否感到很兴奋,能够开发一个将硬件(摄像机、麦克风等)、软件(云服务、ML、计算机视觉、虚拟现实)结合在一起的V1项目,并将重新定义人们在物理空间中的能力?你是否希望成为第四次工业革命先锋的一分子?那么来加入我们的团队吧!”
在2016年9月,微软向Sarcos Robotics投资了一笔资金,这笔资金的数额没有公开。Sarcos Robotics是一家用于“非结构化环境”的灵巧工业机器人的开发商。Sarcos制造了一个“Guardian”机器人产品系列,用于在建筑、制造、石油和天然气、采矿、基础设施检查、物流、公共安全和军队中执行危险任务。
在Cloud & Enterprise方面,微软一直在通过其“Microsoft Connected Vehicle”战略,将其云服务与汽车(包括自动驾驶和非自动驾驶)连接起来。微软没有试图将Windows嵌入到任何地方,而是尝试将车辆和机器连接到其Office 365和Azure服务上。
微软正在设计其Azure IoT Location Based Services,以便与联网汽车、家庭自动化设备、无人机等协同工作。我敢打赌这些服务也适合公司的各种机器人方面的工作。同样,这里也有一个生产力和流程,因为微软的立场是条条道路通往数据分析。
我不知道微软什么时候或者会如何公开其机器人计划。但是我敢打赌这一天不会太久了……
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。