至顶网软件频道消息:客户服务电话真的可以……让人非常生气。造成这种状况的部分原因是人类通常不擅长阅读细微的情绪线索,特别是在只有语音的时候。
同时,我们经常会在无意中广播出意想不到的情绪信号,这些信号很容易导致电话中的沟通不畅并让对方感到不舒服。
但是麻省理工学院一家名为Cogito的附属公司正在使用语音分析来帮助客户服务代表更好地了解客户的感受。Cogito的企业产品背后的技术可以通过分析音调和声音模式来预测客户的情绪状态,该技术也被用于识别退伍军人的创伤后精神压力症(PTSD)和抑郁症的迹象。
设想同样的技术能够为计算机和机器人提供模拟版本的移情并不需要巨大的想象飞跃。
Cogito的分析是因为冲突开发出来的。
2001年,麻省理工学院媒体实验室的Alex "Sandy" Pentland教授正在印度推出亚洲媒体实验室(Media Lab Asia)。《麻省理工学院新闻》(MIT News)一直在跟踪它帮助创立的这家公司,Pentland对《麻省理工学院新闻》(MIT News)表示:“我注意到我们有很多会议——特别是董事会会议——都非常糟糕。”
Pentland推测,问题在于人们传达他们想法的方式——不一定是他们使用的词语,而是这些词语背后的语调和重音。
出于这种经历,Pentland愈发迷恋量化人们说话方式,它常常与人们所说的内容形成鲜明的对比。也就是说,Pentland想要理解隐藏在语言和语气中的微妙线索,以及肢体语言透露的含义,这些都和语言本身无关。
为了帮助他的工作,麻省理工学院的研究人员开发了他们称之为社交仪(sociometers)的设备——使用嵌入式传感器命名徽章,以便在对话过程中跟踪语音和肢体动作的模式。
研究人员可以在不用真正听到谈话的字句的情况下,就预测出诸如求职面试之类互动的结果,准确的程度高得超乎寻常。也就是说,正如行为科学家们长期以来一直认为的那样,每一次互动都会发生多层次的交流,很多层面都是独立于语言之外的。
Pentland的研究很快转向了医疗保健领域,他发现语音分析可以帮助检测抑郁症状或确定医生和患者在交互的过程中是否真的彼此理解。
最近,美国国防部高级研究计划局(DARPA)和美国退伍军人事务部(U.S. Department of Veterans Affairs)已经给予Cogito公司资金以明确这项技术是否可以被用于标示出可能患有创伤后精神压力症(PTSD)的退伍军人,以帮助该事务部更有效地提供服务。Cogito公司是Pentland于2007年同前麻省理工学院MBA学员Joshua Feast合作创立的。
2013年,在美国国防部高级研究计划局(DARPA)支持的一项临床研究中,Cogito注意到经历了波士顿马拉松爆炸事件的实验参与者的创伤后精神压力症(PTSD)相关的态度有所增加。
当然,这些钱是投入了企业产品中。
大约有五百万美国人在呼叫中心工作。 Cogito创建了一个名为Cogito Dialog的产品,该产品可以分析语音信号以确定客户参与度和沮丧情绪等因素。该软件在通话期间为呼叫中心的员工提供实时反馈,使他们能够调整自己说话的方式。
大型健康保险公司Humana进行的一项案例研究表明,在通话中使用了语音分析跟踪后,客户满意度提高了28%,员工参与度则提高了63%。
Pentland表示:“当我们聆听他人说话的时候,它有助于我们的直观理解。”Pentland表示:“可以帮助人们做得更好。”
Cogito的企业客户包括大都会人寿(MetLife)和其他大型保险供应商。
能够促进语言之外的交流和联系可能会对外交和解决冲突产生有趣的影响,并且必将改善我们在人工智能助手和机器人方面的体验。
我很乐意在大型家庭聚会的政治对话期间进行实时分析解读。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。