ZD至顶网软件频道消息: 微软一直在紧锣密鼓地将游戏和Azure服务推至物联网(IOT)设备上。但很少有业界人士注意到,微软同时也在将各种语音功能推至物联网设备。
今年2月,在台北举办的中国WinHEC研讨会上碰巧听了微软的一个名为“用于物联网的自然用户界面技术”的演讲,演讲介绍了微软在物联网语音领域采用的多管齐下策略,目标听众是开发商。
微软为物联网开发商提供各种整合工具,以用于语音和开发商设备的整合:Windows 10有内置的语音应用程序编程接口(API),可完成各种功能,如口述一个简单的消息和网页搜索;微软还提供自然语言服务,全名为语言理解智能服务(缩写为LUIS),LUIS是微软研究院牛津API集合的一部分,可用于非Windows平台。另外,微软还提供Bing翻译、Cortana及微软个人数字助理等工具。
要搞清楚哪个工具是完成某个功能的最佳工具貌似颇为微妙。微软官员在WinHEC研讨会上提供了一个指导框架,框架列出了一些的应用实例,例如如何通过语音控制法式烹饪机(用到LUIS与Windows 10的组合或牛津语音API)或如何用语音控制机器人(用到Windows 10自带语音API)。
微软还展示了一个家庭自动化设备控制的例子,举例说明了用户如何无需使用手机或平板电脑、只利用语音查询自己的车库门是不是关闭妥当。
微软在2016年中国WinHEC会上的演讲,还为物联网开发商提供了利用牛津API进行人脸检测、识别和验证的一些指引。
另外,微软可能会在今年的Build大会上宣布牛津项目(Project Oxford)将结束研究阶段进入商业化之路。微软可能会将牛津项目的一些服务贴上新的Azure认知服务牌子或Azure的智能服务牌子。
好文章,需要你的鼓励
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
Linux内核开发面临动荡时期,Rust语言引入引发摩擦,多名核心开发者相继离职。文章介绍了三个有趣的替代方案:Managarm是基于微内核的操作系统,支持运行Linux软件;Asterinas采用Rust语言开发,使用新型framekernel架构实现内核隔离;Xous同样基于Rust和微内核设计,已有实际硬件产品Precursor发布。这些项目证明了除Linux之外,还有许多令人兴奋的操作系统研发工作正在进行。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。