10月18日,阿里云IoT联合阿里巴巴达摩院正式发布分布式语音交互解决方案,该方案将集成双方的平台连接能力和语音交互技术,以声控的形式完全改造家居环境,只需要简单说上几句话,就能让家里的设备全都“动”起来。
传统语音交互受限于空间,用户只能在智能音箱等单一入口所触达的空间实现声控,而此次发布的分布式语音解决方案,能够将语音交互能力输出到各类家居设备上面,实现“无处不在”的声控体验。
据介绍,该方案包括前端声学模组、语音自学习平台、对话平台以及阿里云IoT智能人居平台,打通了上下游平台串联、端云一体能力,可以大大缩短智能人居环境开发周期,具备很强的扩展能力。
采用该分布式语音解决方案的电器设备,可以通过就近的开关作为智能语音交互入口,即可对全屋智能家居语音控制,通过智能人居平台,家居场景智能设备语音操控将很容易就实现全覆盖,小到开关灯,大到新风系统操控,将完全实现语音触达。
阿里巴巴达摩院语音实验室研究员付强表示,在语音交互前端处理技术和方案的研发上投入了非常大的技术力量,此次和阿里云IoT共同推出的分布式语音交互解决方案,也是一次在声控式人居层面的创新应用。未来,将继续加大在智能语音交互方面的研究和合作,打造更多的全新产品。
当前,语音交互逐渐成为热门领域,特别是在智能家居领域,开始替代以触控为主的交互方式,此次发布的分布式语音交互解决方案,势必为智能智能家居行业带来了新的推动力,未来家居行业也有望迎来全声控时代。
好文章,需要你的鼓励
创业公司Pythagora发布全新AI编程平台,通过14个专业AI代理实现从前端到后端的全栈应用开发。该平台支持开发者和非技术用户仅通过自然语言提示创建应用程序,涵盖规划、编码、测试、调试和部署全流程。与传统AI编程工具不同,Pythagora提供端到端解决方案,AI代理可自动处理前后端开发、API连接、数据库管理等任务,并具备专门的调试功能,让用户无需实际编写代码即可创建完整应用。
字节跳动联合浙江大学发布了ImmerseGen系统,这是一个能根据文字描述自动生成VR世界的AI工具。该系统采用轻量化代理和RGBA纹理技术,用AI代理协作完成从地形生成到物体布置的全流程,还能添加动态效果和环境音效。相比传统方法,它生成的场景效率提升数十倍,在移动VR设备上达到79帧流畅运行,为VR内容创作带来革命性突破。
Context公司推出AI驱动的自动驾驶平台,可同时启动数千个AI代理执行深度研究、数据分析和报告生成等工作。该公司与高通建立战略合作,支持AI代理在骁龙神经处理单元上本地部署,实现在用户个人电脑而非云端运行的AI自动化。平台类似中国AI平台Manus,通过大语言模型执行复杂任务,包括企业搜索、代码解释、文档生成等应用,已完成1100万美元种子轮融资。
慕尼黑大学研究团队开发了SwarmAgentic技术,这是首个能够完全自主生成智能体系统的框架,无需人工预设模板。该技术借鉴蜂群智能原理,让AI系统自己决定需要什么角色、如何分工协作。在旅行规划等六项复杂任务测试中,SwarmAgentic表现优异,在旅行规划任务上比现有最佳方法提升261.8%,展现了全自动智能体系统设计的巨大潜力。