ZD至顶网软件频道消息: 微软一直在紧锣密鼓地将游戏和Azure服务推至物联网(IOT)设备上。但很少有业界人士注意到,微软同时也在将各种语音功能推至物联网设备。
今年2月,在台北举办的中国WinHEC研讨会上碰巧听了微软的一个名为“用于物联网的自然用户界面技术”的演讲,演讲介绍了微软在物联网语音领域采用的多管齐下策略,目标听众是开发商。
微软为物联网开发商提供各种整合工具,以用于语音和开发商设备的整合:Windows 10有内置的语音应用程序编程接口(API),可完成各种功能,如口述一个简单的消息和网页搜索;微软还提供自然语言服务,全名为语言理解智能服务(缩写为LUIS),LUIS是微软研究院牛津API集合的一部分,可用于非Windows平台。另外,微软还提供Bing翻译、Cortana及微软个人数字助理等工具。
要搞清楚哪个工具是完成某个功能的最佳工具貌似颇为微妙。微软官员在WinHEC研讨会上提供了一个指导框架,框架列出了一些的应用实例,例如如何通过语音控制法式烹饪机(用到LUIS与Windows 10的组合或牛津语音API)或如何用语音控制机器人(用到Windows 10自带语音API)。


微软还展示了一个家庭自动化设备控制的例子,举例说明了用户如何无需使用手机或平板电脑、只利用语音查询自己的车库门是不是关闭妥当。
微软在2016年中国WinHEC会上的演讲,还为物联网开发商提供了利用牛津API进行人脸检测、识别和验证的一些指引。
另外,微软可能会在今年的Build大会上宣布牛津项目(Project Oxford)将结束研究阶段进入商业化之路。微软可能会将牛津项目的一些服务贴上新的Azure认知服务牌子或Azure的智能服务牌子。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。