至顶网软件频道消息: 1月15日,在北京举办的2019阿里云数字地产峰会上,阿里云发布分布式语音解决方案2.0,赋能硬件合作伙伴,以语音能力为智能空间带来全新交互体验。
据了解,此次发布的分布式语音交互解决方案包括前端声学模组、语音自学习平台、对话平台、阿里云IoT智能人居平台,可实现上下游平台串联、端云一体能力打通,并以标准化能力输出,帮助厂家快速应用,缩短开发周期,具备强扩展能力。
目前,市场上的语音交互设备多以智能音箱单品的形式呈现,往往只能服务到客厅或卧室等单个智能空间。通过分布式语音方案与开关面板,温控器,冰箱等各种设备结合,可将语音交互能力快速与室内场景融合,使屋内处处都具有语音识别能力,让业主只需动嘴,就能轻松享受智能家居生活。
此外,阿里巴巴分布式语音技术不仅能通过对话实现单个智能设备的控制和关联多设备的场景控制,而且还能实现分布式语音控制和流式多意图识别。客厅的语音指令,会精准定向到客厅的智能化设备进行执行。而且每条指令不再是生硬的意图表达,而更多像在和一个你的专属管家聊天,“请帮我关闭灯,拉上窗帘,对了,再把空调调到25度。”这样口语化的表达,将使业主在室内的人机交互体验变得更加轻松有趣。
相关负责人表示,阿里巴巴在语音交互前端处理技术和方案的研发上投入了非常大的技术力量,此次和阿里云共同发布的分布式语音生态能力,旨在赋能合作伙伴,升级智能空间的交互方式。未来,阿里将继续加大在智能语音交互方面的研究和合作,打造更多的全新产品。
好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。