近日,豆包语音对话功能迎来更新,可以说4种地道方言,包括粤语、四川话、东北话及陕西话。用户打开豆包App对话框,发送简单的文字或语音指令,要求豆包使用上述方言对话,通过默认的“温柔桃子”升级版音色,即可开启对话体验。
据悉,该功能借助豆包语音模型方言迁移技术,实现单音色说多方言,且具备思考能力,可根据用户意图,灵活切换方言。记者实测发现,豆包可以精准识别相关方言语音和词汇,并用地道自然的方言回应。对于不熟悉普通话的用户,尤其是习惯说方言的老年群体来说,该功能有助于辅助沟通,提高效率。

除了能说4种地道方言外,豆包在对话过程中能听懂上海话、南京话等18种方言。上述能力借助了将口语转录为文本的ASR技术 (Automatic Speech Recognition),准确性和效率提升明显。
豆包相关负责人表示,豆包致力于提升不同人群的使用体验,希望不同地域的用户能够更轻松、自然地与豆包进行语音交互,享受技术带来的便捷。
好文章,需要你的鼓励
由贝索斯共同领导的普罗米修斯项目已收购AI初创公司General Agents。该公司开发了名为Ace的AI智能体,可自主执行视频编辑、数据复制等计算机任务。General Agents基于视频语言行为架构开发模型,这与普罗米修斯项目专注制造业AI系统的目标高度契合。收购完成后,普罗米修斯团队已超过100人,预计将推进工业机器人领域的AI应用发展。
斯科尔科技学院联合俄罗斯多家研究机构开发出革命性的多语言AI虚假信息检测技术。该研究构建了覆盖14种语言的大型数据集PsiloQA,通过"诱导AI说谎"的创新方法自动生成训练样本,成本仅为传统人工标注的数十分之一。实验证明多语言训练的检测模型性能显著优于单语言模型,为全球AI可信度监督提供了实用解决方案。
Kagi公司发布Orion浏览器1.0版本,这是一款专为苹果平台设计的全新浏览器。该浏览器主打极速浏览体验和用户隐私保护,完全免费使用并附赠200次Kagi搜索。Orion还提供月费5美元的付费订阅服务,解锁更多高级功能。未来计划包括更深度的自定义选项和性能优化。
NVIDIA研究团队发现,训练机器人最有效的方法竟然是最简单的:直接用普通文字告诉机器人该做什么,而不需要复杂的编码系统。他们开发的VLA-0系统在标准测试中超越了所有复杂方法,平均成功率达94.7%,在真实机器人测试中也比预训练系统高出12.5个百分点。这项发现挑战了"越复杂越好"的传统观念,可能加速智能家用机器人的普及。