语音AI初创公司Bland联合创始人兼CEO Isaiah Granet分享了一种颠覆传统的招聘方法。该公司在不到一年时间内从种子前轮发展到B轮融资,其成功秘诀在于优先考虑工作热情而非学历背景,注重工作态度、好奇心和灵活性。节目探讨了如何在意想不到的地方发现优秀人才,非传统人才招募方式,以及招聘理念如何塑造企业文化等话题。
语音AI初创公司Bland联合创始人兼CEO Isaiah Granet分享了其独特的招聘理念。该公司在不到一年时间内从种子前轮融资发展到B轮融资,采用了颠覆性的招聘方法:优先考虑工作态度、好奇心和灵活性,而非简历和人脉关系。讨论内容包括如何在意想不到的地方发现"隐藏宝石"人才、非常规人才寻源的作用,以及招聘理念如何塑造公司文化。
AI驱动的会议记录应用Granola估值2.5亿美元,深受科技行业创始人和投资人青睐。英国开发者Nick Payne认为市场需要更私密的本地化替代方案,因此创建了Mac应用Talat。该应用利用苹果Neural Engine在本地处理音频转录,无需将语音数据上传至云端。Talat支持实时转录、发言人识别、会议摘要生成等功能,所有数据均存储在本地设备上,售价49美元一次性购买。
数字会议记录工具如Read AI、Fireflies.ai等可处理在线会议,但对于现场会议,许多人偏爱物理录音设备。这些AI笔记设备能录制音频并提供会议摘要和行动项目。产品包括可穿戴的胸针或吊坠式设备,以及信用卡大小的便携设备,配备专用应用程序进行AI转录和洞察提取。部分设备还支持实时翻译功能,为用户提供多样化的会议记录解决方案。
IBM Granite语音模型在澳大利亚皇家飞行医生服务的测试中表现卓越,能在飞机引擎噪音环境下准确识别医护人员语音。该技术将医护记录时间从28分钟缩短至2分钟,显著提升工作效率。相比其他主流模型,Granite在嘈杂环境中的语音理解能力更强,为语音输入应用开辟新可能性。
亚马逊正式将其AI驱动的对话助手Alexa+引入英国,这是北美以外首个获得该服务的国家。目前英国用户可通过早期访问计划免费试用,购买新款Echo设备即可获得邀请。早期访问结束后,Prime订阅用户可免费使用,非Prime用户需支付每月19.99英镑。Alexa+支持Echo设备、Fire TV和应用程序,并针对英国用户进行了本地化定制优化。
WAXAL为非洲语音技术提供重要开放资源基础,包含27种本土语言的大规模ASR和TTS数据集,采用高度宽松许可证。该数据集由谷歌研究团队与非洲学术和社区组织合作开发,包含约1846小时转录自然语音和565小时高保真录音,旨在支撑非洲AI生态系统构建反映地区语言多样性的语音系统。
Krisp公司发布了听者端口音转换系统,通过在听者设备上本地处理语音,实时优化带口音的英语发音,提升交流理解效果。该技术仅对听者进行语音适配,不改变说话者原声,延迟低于200毫秒且无需云端处理。系统针对印度、菲律宾、拉美、非洲和中文普通话口音效果显著,可集成到会议软件和呼叫中心AI平台中。
AI初创公司aiOla发布名为QUASAR的"语音智能网关",通过动态路由技术将音频请求分配给最适合的语音识别模型。该系统能识别说话者口音、音频条件和领域语境,自动选择最佳ASR系统进行转录。内部测试显示,QUASAR在88.8%的通话中成功选择了性能最佳的ASR模型,显著提升了AI与人类对话的准确性,解决了企业语音识别系统的可靠性问题。
数字会议记录工具如ReadAI、Fireflies.ai等可记录在线会议,而物理录音设备则适用于面对面场景。这些AI笔记设备能转录音频并生成会议摘要和行动清单。部分产品为可穿戴设备,如别针或吊坠式,配备专用麦克风;其他为信用卡大小,配套移动应用进行AI转录分析。主要产品包括Plaud Note系列、Mobvoi TicNote、Comulytic Note Pro等,价格从89美元到200美元不等,多数提供实时转录和多语言翻译功能。
华盛顿大学研究团队开发出一款"主动式听力助手",利用AI技术实时识别对话伙伴并增强其语音。该系统通过分析人类对话中的轮流发言模式,自动过滤无关声音,仅放大参与对话者的声音。系统采用双模型架构,延迟低于10毫秒,识别准确率达80-92%,语音清晰度提升14.6分贝,为听力障碍人群提供更自然的听觉体验。
德国柏林AI客户体验自动化平台Parloa宣布完成3.5亿美元后期融资,估值达30亿美元,由General Catalyst领投。该公司提供企业级AI驱动的客户体验自动化解决方案,从客户致电联系中心开始覆盖整个服务流程。通过更"人性化"的响应自动化繁琐的客服操作,帮助客户顺畅完成原本缓慢复杂的体验流程,避免因自动化系统问题导致客户流失。
VoiceRun是一家帮助企业开发可控语音AI代理的初创公司,已获得550万美元种子轮融资。本轮融资由Flybridge Capital Partners领投,RRE Ventures和Link Ventures参投。该公司采用代码优先方法,为企业提供满足严格可靠性、安全性和治理要求的语音AI代理开发平台,支持餐饮、保险、银行和电信等行业应用。
亚马逊在今年CES展会上展示了最新收购的AI设备Bee,这是一款可作为胸针或手链佩戴的智能设备。Bee主要用于录制对话、会议或课程,同时充当AI助手。与专注室内场景的Alexa不同,Bee专注户外应用,两者形成互补关系。Bee能够学习用户模式和习惯,提供个性化建议。该设备在转录对话后会删除音频,适合学生、老年人和职场人士使用。
Pebble推出Index 01智能戒指,内置麦克风用于录制想法和提醒事项。该戒指可通过按键激活录音功能,与安卓和iOS设备兼容,录音内容可发送至笔记应用等。具有近乎无限的电池续航,采用银氧化物助听器电池,无需充电。预售价75美元,2026年3月发货后涨至99美元。
AI笔记公司Plaud在CES 2026推出新款可穿戴设备NotePin S,可夹在衣领、戴在手腕或挂在脖子上记录对话。该设备通过蓝牙连接手机,配备双麦克风,录制范围约3米,支持一键高亮标记重要时刻。同时发布的还有Plaud Desktop桌面AI记录工具,可原生捕获线上会议内容,无需机器人加入通话。两款产品将所有笔记、会议和对话整合到统一平台管理。
Thine公司在CES 2026上展示了基于iPhone的AI笔记应用,CEO认为无需开发专用硬件设备,直接利用手机现有的麦克风和Siri功能即可实现对话记录和转录。该应用训练AI模型分析对话记录,用户可询问特定对话内容。目前月费200美元,主要面向高管用户,但随着技术改进和规模扩大,价格有望大幅下降。公司不存储音频文件,正在开发提供完整转录文本的新版本,长期存储和安全保护是主要成本。
Vocci AI推出的智能戒指在CES 2025展出,专为职场应用设计。该戒指通过手动按压侧面按钮开始录音,会议结束后自动生成转录文本。用户可在重要时刻再次按压按钮进行标记,AI会在转录中用红色标注并提供洞察分析。戒指厚2.8毫米,宽6.8毫米,支持100多种语言,可录制约8小时内容。录音数据保存在云端,预计2月开启预订,4月首批发货。
硬件制造商Plaud在CES展会前发布了新款AI记录设备NotePin S和桌面应用程序。新款别针售价179美元,配备物理按钮控制录制,支持点击标记重点,包含夹子、挂绳、磁性别针和腕带等多种佩戴方式,并支持苹果查找功能。设备拥有64GB存储和20小时续航,双MEMS麦克风可在3米范围内清晰录音。
SwitchBot在CES展会上发布了AI MindClip,这是一款可穿戴麦克风设备,能够记录并转录用户说出的每一个声音。该产品配备AI功能,可以总结对话内容并提取有用数据,还能根据判断主动创建提醒事项。虽然类似产品在本届CES上不少见,但SwitchBot希望通过智能化功能在竞争中脱颖而出。目前产品的具体上市时间和价格尚未公布。