中国上海——2022年4月12日——恩智浦半导体(NXP Semiconductors N.V.,纳斯达克股票代码:NXPI)宣布推出智能语音技术(VIT),业内首批全面本地语音控制软件包,不限量产数量,客户均可免费获取配套的在线训练工具。VIT基于先进的深度学习技术,是一款即时可用的软件库,提供可支持多达3个麦克风的远场音频前端、始终打开的唤醒词引擎和语音命令引擎。通过恩智浦的免费在线工具,无需录音,客户可使用简单的文本输入自行定义唤醒词和语音命令。
产品重要性
实现可靠的设备端语音控制颇具挑战。开发人员不仅需要选择合适的硬件,还必须驾驭复杂的语音处理软件。这通常需要开发人员管理来自不同软件供应商的音频前端波束成形器、单独的唤醒词和语音命令引擎。VIT软件解决方案全面、灵活,可针对特定应用定制,从而简化了开发过程,同时解决方案中已加入创建高度精确的设备端语音控制解决方案所需的全部要素。
更多详情
恩智浦副总裁兼物联网边缘处理产品线总经理Joe Yu:“语音是许多智能技术的首选接口,包括智能家居、智慧城市和智慧工厂中的各种技术。通过降低语音应用开发的复杂程度,我们帮助客户更轻松迅速地将新的设备端语音控制推向市场。”
好文章,需要你的鼓励
许多CIO在实施AI战略时因良好初衷反而导致失败。专家指出,仅为AI而做AI会浪费资金且无实际成果,应先评估业务价值。CIO常见错误包括:让风险规避型利益相关者施加过度限制、仅依赖现成AI工具而不深度整合、在人员和流程问题未解决时强推技术转型。成功的关键是确保AI解决方案真正节省时间并带来业务价值,需要有权威的负责人推动决策,同时不惧怕小规模试错,快速迭代改进。
谷歌研究院开发出一种革命性的人工智能技术,通过学习人类眼动轨迹来提升视觉问答能力。该技术像训练侦探一样教会AI关注图像中的关键区域,准确率提升3-10%。研究发表于CVPR 2024,在教育、医疗、无人驾驶等领域具有广阔应用前景,为AI向人类智慧靠近开辟了新路径。
Kahoot是一个基于游戏的学习平台,涵盖科学、历史、地理、英语和数学等领域。该平台于2023年推出AI功能,AI生成器可从主题、文档、网站或视频链接即时创建互动学习体验,帮助教师减少备课时间,让学习更具吸引力和个性化。平台支持50种语言,拥有120亿用户,还提供翻译工具和AI驱动的学习推荐功能。
英国卡迪夫大学研究团队通过脑电图技术发现,当人们体验虚假听觉(即"听到"实际不存在的语音)时,大脑的神经活动模式与听到真实声音时几乎相同。研究揭示了大脑会根据语言经验和上下文自动"填补"缺失的语音片段,这一发现对理解听觉障碍、改进助听设备以及开发更智能的语音识别系统具有重要意义。