至顶网软件频道消息:客户服务电话真的可以……让人非常生气。造成这种状况的部分原因是人类通常不擅长阅读细微的情绪线索,特别是在只有语音的时候。
同时,我们经常会在无意中广播出意想不到的情绪信号,这些信号很容易导致电话中的沟通不畅并让对方感到不舒服。
但是麻省理工学院一家名为Cogito的附属公司正在使用语音分析来帮助客户服务代表更好地了解客户的感受。Cogito的企业产品背后的技术可以通过分析音调和声音模式来预测客户的情绪状态,该技术也被用于识别退伍军人的创伤后精神压力症(PTSD)和抑郁症的迹象。
设想同样的技术能够为计算机和机器人提供模拟版本的移情并不需要巨大的想象飞跃。
Cogito的分析是因为冲突开发出来的。
2001年,麻省理工学院媒体实验室的Alex "Sandy" Pentland教授正在印度推出亚洲媒体实验室(Media Lab Asia)。《麻省理工学院新闻》(MIT News)一直在跟踪它帮助创立的这家公司,Pentland对《麻省理工学院新闻》(MIT News)表示:“我注意到我们有很多会议——特别是董事会会议——都非常糟糕。”
Pentland推测,问题在于人们传达他们想法的方式——不一定是他们使用的词语,而是这些词语背后的语调和重音。
出于这种经历,Pentland愈发迷恋量化人们说话方式,它常常与人们所说的内容形成鲜明的对比。也就是说,Pentland想要理解隐藏在语言和语气中的微妙线索,以及肢体语言透露的含义,这些都和语言本身无关。
为了帮助他的工作,麻省理工学院的研究人员开发了他们称之为社交仪(sociometers)的设备——使用嵌入式传感器命名徽章,以便在对话过程中跟踪语音和肢体动作的模式。
研究人员可以在不用真正听到谈话的字句的情况下,就预测出诸如求职面试之类互动的结果,准确的程度高得超乎寻常。也就是说,正如行为科学家们长期以来一直认为的那样,每一次互动都会发生多层次的交流,很多层面都是独立于语言之外的。
Pentland的研究很快转向了医疗保健领域,他发现语音分析可以帮助检测抑郁症状或确定医生和患者在交互的过程中是否真的彼此理解。
最近,美国国防部高级研究计划局(DARPA)和美国退伍军人事务部(U.S. Department of Veterans Affairs)已经给予Cogito公司资金以明确这项技术是否可以被用于标示出可能患有创伤后精神压力症(PTSD)的退伍军人,以帮助该事务部更有效地提供服务。Cogito公司是Pentland于2007年同前麻省理工学院MBA学员Joshua Feast合作创立的。
2013年,在美国国防部高级研究计划局(DARPA)支持的一项临床研究中,Cogito注意到经历了波士顿马拉松爆炸事件的实验参与者的创伤后精神压力症(PTSD)相关的态度有所增加。
当然,这些钱是投入了企业产品中。
大约有五百万美国人在呼叫中心工作。 Cogito创建了一个名为Cogito Dialog的产品,该产品可以分析语音信号以确定客户参与度和沮丧情绪等因素。该软件在通话期间为呼叫中心的员工提供实时反馈,使他们能够调整自己说话的方式。
大型健康保险公司Humana进行的一项案例研究表明,在通话中使用了语音分析跟踪后,客户满意度提高了28%,员工参与度则提高了63%。
Pentland表示:“当我们聆听他人说话的时候,它有助于我们的直观理解。”Pentland表示:“可以帮助人们做得更好。”
Cogito的企业客户包括大都会人寿(MetLife)和其他大型保险供应商。
能够促进语言之外的交流和联系可能会对外交和解决冲突产生有趣的影响,并且必将改善我们在人工智能助手和机器人方面的体验。
我很乐意在大型家庭聚会的政治对话期间进行实时分析解读。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。