10月18日,阿里云IoT联合阿里巴巴达摩院正式发布分布式语音交互解决方案,该方案将集成双方的平台连接能力和语音交互技术,以声控的形式完全改造家居环境,只需要简单说上几句话,就能让家里的设备全都“动”起来。
传统语音交互受限于空间,用户只能在智能音箱等单一入口所触达的空间实现声控,而此次发布的分布式语音解决方案,能够将语音交互能力输出到各类家居设备上面,实现“无处不在”的声控体验。
据介绍,该方案包括前端声学模组、语音自学习平台、对话平台以及阿里云IoT智能人居平台,打通了上下游平台串联、端云一体能力,可以大大缩短智能人居环境开发周期,具备很强的扩展能力。
采用该分布式语音解决方案的电器设备,可以通过就近的开关作为智能语音交互入口,即可对全屋智能家居语音控制,通过智能人居平台,家居场景智能设备语音操控将很容易就实现全覆盖,小到开关灯,大到新风系统操控,将完全实现语音触达。
阿里巴巴达摩院语音实验室研究员付强表示,在语音交互前端处理技术和方案的研发上投入了非常大的技术力量,此次和阿里云IoT共同推出的分布式语音交互解决方案,也是一次在声控式人居层面的创新应用。未来,将继续加大在智能语音交互方面的研究和合作,打造更多的全新产品。
当前,语音交互逐渐成为热门领域,特别是在智能家居领域,开始替代以触控为主的交互方式,此次发布的分布式语音交互解决方案,势必为智能智能家居行业带来了新的推动力,未来家居行业也有望迎来全声控时代。
好文章,需要你的鼓励
许多CIO在实施AI战略时因良好初衷反而导致失败。专家指出,仅为AI而做AI会浪费资金且无实际成果,应先评估业务价值。CIO常见错误包括:让风险规避型利益相关者施加过度限制、仅依赖现成AI工具而不深度整合、在人员和流程问题未解决时强推技术转型。成功的关键是确保AI解决方案真正节省时间并带来业务价值,需要有权威的负责人推动决策,同时不惧怕小规模试错,快速迭代改进。
谷歌研究院开发出一种革命性的人工智能技术,通过学习人类眼动轨迹来提升视觉问答能力。该技术像训练侦探一样教会AI关注图像中的关键区域,准确率提升3-10%。研究发表于CVPR 2024,在教育、医疗、无人驾驶等领域具有广阔应用前景,为AI向人类智慧靠近开辟了新路径。
Kahoot是一个基于游戏的学习平台,涵盖科学、历史、地理、英语和数学等领域。该平台于2023年推出AI功能,AI生成器可从主题、文档、网站或视频链接即时创建互动学习体验,帮助教师减少备课时间,让学习更具吸引力和个性化。平台支持50种语言,拥有120亿用户,还提供翻译工具和AI驱动的学习推荐功能。
英国卡迪夫大学研究团队通过脑电图技术发现,当人们体验虚假听觉(即"听到"实际不存在的语音)时,大脑的神经活动模式与听到真实声音时几乎相同。研究揭示了大脑会根据语言经验和上下文自动"填补"缺失的语音片段,这一发现对理解听觉障碍、改进助听设备以及开发更智能的语音识别系统具有重要意义。