自上世纪九十年代以来,如何与娱乐行业就经历了数波影响深远的颠覆性浪潮。首先是互联网的出现,这在21世纪的第一个十年实现了内容的数字化分发,并在第二个十年再次颠覆分发形式,实现了从下载到流媒体直播/点播等新形式。而得益于AI技术的迅猛发展,第三波浪潮正在新的十年中再度兴起。
电影和电视工作室的传统商业模式,正在受到流媒体及社交媒体平台上海量原创及分发内容的威胁。过去几年来,行业各主要工作室的收入下降达两位数。而围绕流媒体的新商业模式虽在兴起,但也大多尚未展现出可观的利润,甚至仍处于亏损状态。面对过渡时期的难题,AI技术将如何为新的、更具持久生命力的媒体与娱乐经济形态做出贡献?
在上周于洛杉矶举行的2024年好莱坞创新与转型峰会暨娱乐发展研讨会上,我们明确迎来了这个问题的答案。这场为期一天的活动由好莱坞IT协会与佩珀代因大学格拉齐亚迪奥商学院合作举办,旨在通过学者与行业专家的共同努力解决复杂的业务问题。
多位发言者预测,AI技术将让新的业务与内容制作流程变得效率更高、更加简洁。例如,Box’sBox联合创始人Aaron Levie就谈到得益于AI技术的支持,电影资产能够被准确编入索引,帮助拍摄与后期制作部门以更短的时间快速搜索数字文件,腾出精力专注于完善最终产品。此外,从合同到发票的处置流程也将实现重大收益。
在另一方面,生产力的提升也将在创意方面有所体现。由视觉特效公司ICVR领导的视觉特效会议,展示了生成式AI如何帮助线制片人完成从剧本到预可视化阶段中70%的工作,成功将原本需要一周的工作量成功压缩到几个小时以内。部分AI辅助方案还有助于提升产品质量。例如在一款名为Flawless AI TrueSync工具的演示当中,其使用AI技术实现了多语种配音及对话内容修改,并可无缝转换嘴部动作及面部表情。
流程效率的提高将使创意人员减少对行政及其他程序性任务的关注,将更多时间和精力投入到创作当中。来自沃顿商学院的John C. Hower教授,以及AI驱动剧本与知识产权管理自动化工具Jumpcut创始人Kartik Hosanager也都提到了各自的颠覆性应用方向,认为技术当初已经将我们从手工业时代推向信息工业时代,而如今的AI将创造出一个人类得以专注于创造力、同理心与领导力的全新阶段。
此外,AI技术还有助于改善决策与生产质量。在The Ankler公司Elaine Low与Sean McNulty参加的研讨会上,他们就分享了支持决策制定的AI内容策略分析,以及如何使用流数据根据收视率分析(而非传统直觉)做出更好、更具包容性的选角决策。
会上也出现了很多关于AI如何改善创作工作流程,以及AI技术实质性提升客户体验的案例。
但也有人就三种风险发出警告:首先,由于存在输入偏差或者完整性缺失,AI输出同样可能包含偏差及偏见。其次,如果不能完全透明地解释哪些内容由AI生成,或者训练数据的来源不完全透明,那么错误信息很可能快速传播。第三,在使用生成式AI创作或协助创作文本、音频和视频时,往往会带来层出不穷的知识产权问题。关于最后一点,OpenAI公司就曾因在ChatGPT 4的语音版本中使用与斯嘉丽·约翰逊非常相似的声色而引发广泛争议,此事也在会上被多次提及。
总体而言,本次会议上人们对AI创新普遍持支持态度,认为风险并不会抵消这项新兴技术带来的巨大机会空间。与会者们都相信AI技术将在未来几十年内推动新媒体与娱乐经济的又一波发展,现有AI应用演示也欣然实现了效率提升、内容增强与决策优化等实际成效。凡此种种,表明围绕AI开展的创新必将对商业乃至创意工作流程产生深远的变革性影响。
幸运的是,从宏观层面看这场重大转型才刚刚起步。而抗拒AI技术者将被时代所淘汰,已经成为整个媒体与娱乐行业的广泛共识。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。