人工智能(AI)正在以惊人的速度向前狂奔,本文将带大家一同展望这项前沿科技给好莱坞造成的实际影响。
AI视频。很多朋友已经知晓,如今的AI能够编写出完整剧本、创作乐曲并根据文本命令生成图片。而下一阶段的发展逻辑也已相当清晰:我们可以用文字描述想要获取的内容,再由AI系统创作出逼真的视频画面。目前已经有不少网站能够执行此类操作,搜在索引擎中输入“文本到视频”即可轻松找到它们。相信不久之后,这些网站就能把完整的剧本转换成一部配乐精良、人物生动且包含对话的长片。这样的发展将对好莱坞的运作模式和就业岗位产生深远的影响。Tyler Perry在果断停止耗资8亿美元的亚特兰大工作室扩建项目时,就曾明确表示“工作岗位正在流失”。而据前沿人士的预测,未来五年内制作一部电影的成本将降至目前成本的十分之一,这既意味着将有更多人找到新的工作,也代表不少工作室将就此烟消云散。
版权。近来针对AI厂商的诉讼越来越多,主要指控就是其输入(将内容上传至AI系统)和输出(由AI系统生成的结果)涉嫌侵犯版权。迄今为止,大部分“其中有某处抄袭了我的作品”的输出类案件由于跟原作相似度不太高,所以普遍遭遇败诉。但在另一方面,由于原告方确实掌握着被上传至AI系统的作品的注册版权,所以输入类案件仍处于悬而未决的状态。对于此类案件应如何判罚,最终可能要交由最高法院给出裁定。为了避免诉讼,部分AI公司开始提前为内容库支付许可费用,并提出修改版权法的建议,要求遵循音乐拷贝的惯例实施强制许可加强制付费的制度。
诽谤。考虑到AI系统往往有着强烈的“幻觉”倾向,很多朋友应该都在试用相关服务时看到过那些子虚乌有且令人反感的“造谣”结果。AI厂商们也自然要因此承担诽谤指控。今年一月,法院驳回了否决此类案件的动议,意味着AI系统可能需要为此类诉讼承担责任。但院方是否会以《通信规范法》第230条的内容(这一条款规定了互联网平台对于第三方用户在其平台上发布的言论内容不负有法律责任,同时也允许互联网平台基于「善意原因」封锁和屏蔽冒犯性内容)为依据处置AI生成输出,目前仍然有待观察。
民众权益。截至目前,美国各州法律及相互冲突的判例记录,明显给针对AI的公开诉讼造成了巨大障碍。然而近期出现的一系列极端案例,包括新罕布什尔州的初选阶段出现的用AI模仿拜登给选民打电话,以及Taylor Swift的伪造色情视频等,再次为悬而未决的联邦立法提供了新的动力。立法机构显然应该在问题扩大之前积极行动,有效保护个人安全。
打不过,就加入?不少名人则选择利用AI技术扩大自己的优势,包括许可AI以特定方式使用自己的姓名、声音和/或图像。例如,Meta(原Facebook)已经拿下众多名人的语音与肖像版权以供AI使用,粉丝可以随心所欲操纵这些语音和图像,包括为名人实际代言产品的竞争对手制作宣传材料等。种种潜在应用所在多有,大家可以尽情发挥脑洞。
行会协议。目前针对AI技术,各行会正着手发布一系列相应协议要求:
DGA(美国导演协会)。在新协议的三年期限之内,各工作室不得使用AI技术取代任何DGA成员职位。
WGA(美国编剧协会)。根据WGA的基本协议,AI撰写的任何材料均不可被视为“文学材料”,因此无助于成员补贴或补偿。
SAG(美国电影演员公会)。未经会员在单独协议中明确同意 (包括对预期胜任及任何预期变更的说明),工作室不得使用AI来复制SAG会员。在工作室使用AI技术创造全新肖像之前,首先需要与SAG真诚协商并给予适当补偿。
本文重点关注好莱坞娱乐行业,但生成式AI浪潮已经影响到当今世界的每一个角落。值得注意的是,近期有不少律师事务所就因提交AI生成的简报而受到制裁。这些简报中充斥着大量看似真实,但却纯由AI幻觉输出的虚构引用。看来AI仍具有很大的局限性,也让我们人类能稍微松口气。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。