人工智能初创公司Zyphra推出了两款开源文本转语音模型,声称只需5秒样本音频就能克隆声音。测试显示,使用不到30秒的录音即可生成逼真效果。这项技术虽然存在滥用风险,但也有积极应用前景,如帮助失声者重获声音。该模型采用开源许可证发布,为语音合成领域带来新的可能。
目前,虚拟制作行业发展已经从以CG、语音合成的计算机技术为主的阶段,经历5G、人工智能技术突破,到现在,进入高速发展的新阶段,虚拟制作的应用领域逐步拓宽,全方面渗透进入各个行业。