麻省理工学院和IBM Watson AI Lab的研究人员创建了一个机器学习模型,用于预测听众在3D空间内的不同位置上会听到什么。
研究人员首先使用这个机器学习模型来了解房间中的任何声音是如何在空间中传播的,按照人们通过声音理解自身所处环境的方式构建3D房间的图景。
在麻省理工学院电气工程与计算机科学系(EECS)研究生Yilun Du共同撰写的一篇论文中,研究人员们展示了如何将类似于视觉3D建模的技术应用于声学领域。
但是他们要面对声音和光线传播的不同之处。例如,由于障碍物、房间的形状和声音的特性,听众处在房间中不同的位置可能会对声音产生非常不同的印象,从而让结果变得难以预测。
为了解决这个问题,研究人员们在他们的模型中建立了声学特征。首先,在所有其他条件都相同的情况下,交换声音源和听众的位置不会改变听众听到的内容。声音还特别受本地条件影响,例如位于听众和声音源之间的障碍物。
Du表示:“到目前为止,大多数研究人员只专注于视觉建模。但是作为人类,我们有多种感知模式。不仅视觉很重要,声音也很重要。我认为这项工作开辟了一个令人兴奋的研究方向,可以更好地利用声音来模拟世界。”
使用这种方法,生成的神经声场(NAF)模型能够对网格上的点进行随机采样,以了解特定位置的特征。例如,靠近门口会极大地影响听众听见房间另一侧声响的内容。
该模型能够根据听众在房间中的相对位置预测听众可能从特定声学刺激中听到的内容。
这篇论文表示:“通过将场景中的声学传播建模为线性时不变系统,NAF学会不断地将发射器和听众的位置映射到神经脉冲响应函数,后者可以应用于任意声音。”“我们证明了NAF的连续性让我们能够在任意位置为听众渲染空间声音,并且可以预测声音在新位置的传播。”
MIT-IBM Watson AI Lab的首席研究员Chuang Gan 也参与了该项目,他表示:“这项新技术可能会为在元宇宙应用程序创建多模态沉浸式体验带来新的机会。”
我们知道不是所有 Reg 读者都会对这个用例感到兴奋。
好文章,需要你的鼓励
人工智能革命正在重塑各行各业的CIO角色,为技术领导者创造前所未有的机会来提升其战略影响力。在东北杂货店,这一转变使未来准备责任得以在整个组织中重新分配。CIO不再是唯一负责预见未来技术需求的人,而是通过赋予业务伙伴AI能力,使展望未来成为共同努力。AI的"WOW"因素不仅提高了效率和生产力,还将CIO从服务提供者转变为赋能整个业务生态系统的动力创造者。
一份新报告预测,到2035年人工智能将从根本上改变人类行为、认知和关系。专家们认为,AI 将深刻影响人的思维方式、情感能力和自主性,可能导致认知能力衰退、社交技能下降和个人独立性减弱。同时也可能加剧社会极化,削弱共同价值观。尽管存在担忧,部分专家仍对 AI 增强人类能力持乐观态度。这份报告引发了对 AI 如何重塑人类本质的深入思考。
Tomer Cohen作为LinkedIn的首席产品官,负责管理产品、用户体验和客户运营团队。他从以色列移居硅谷,在斯坦福大学就读期间被LinkedIn的理念所吸引。Cohen加入公司后,推动了从桌面到移动平台的转型,并致力于开发社交信息流等产品。他认为LinkedIn的核心价值在于连接人与职业网络,为用户提供发展机会。在Cohen的领导下,LinkedIn从单一的求职网站发展成为日常工作工具,拥有超10亿用户。他表示,未来将继续借助AI等技术,为用户提供更个性化的体验。
据《纽约时报》报道,亚马逊突然加入 TikTok 收购竞争,提交了全面收购报价。然而,交易各方似乎并不重视这一出价。TikTok 面临 4 月 5 日前剥离中国所有权或在美国遭禁的最后期限。特朗普总统将于周三与官员讨论 TikTok 的命运,他表示交易将在期限前敲定。与此同时,其他潜在买家如 Andreessen Horowitz 和 Blackstone 也在积极参与竞购。