中国上海——2022年4月12日——恩智浦半导体(NXP Semiconductors N.V.,纳斯达克股票代码:NXPI)宣布推出智能语音技术(VIT),业内首批全面本地语音控制软件包,不限量产数量,客户均可免费获取配套的在线训练工具。VIT基于先进的深度学习技术,是一款即时可用的软件库,提供可支持多达3个麦克风的远场音频前端、始终打开的唤醒词引擎和语音命令引擎。通过恩智浦的免费在线工具,无需录音,客户可使用简单的文本输入自行定义唤醒词和语音命令。
产品重要性
实现可靠的设备端语音控制颇具挑战。开发人员不仅需要选择合适的硬件,还必须驾驭复杂的语音处理软件。这通常需要开发人员管理来自不同软件供应商的音频前端波束成形器、单独的唤醒词和语音命令引擎。VIT软件解决方案全面、灵活,可针对特定应用定制,从而简化了开发过程,同时解决方案中已加入创建高度精确的设备端语音控制解决方案所需的全部要素。
更多详情
恩智浦副总裁兼物联网边缘处理产品线总经理Joe Yu:“语音是许多智能技术的首选接口,包括智能家居、智慧城市和智慧工厂中的各种技术。通过降低语音应用开发的复杂程度,我们帮助客户更轻松迅速地将新的设备端语音控制推向市场。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。