科技行者

转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道爱奇艺CTO汤兴:未来的娱乐是AI娱乐

爱奇艺CTO汤兴:未来的娱乐是AI娱乐

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

在七年的发展历程中,爱奇艺始终重视数据的价值,不断利用新技术探索视频网站的边界,努力提升用户体验,并凭此吸引着更多用户,搭建了以技术为驱动的AI娱乐生态。

作者:赵东 来源:至顶网软件频道 【原创】 2017年6月9日

关键字:汤兴 视频 AI 爱奇艺

至顶网软件频道消息: 爱奇艺正在用AI分析海量内容和用户行为,实现内容管理、创作以及理解用户意图等多方面复杂的、难以人工完成的工作。爱奇艺CTO汤兴称其为“AI娱乐”。

爱奇艺CTO汤兴:未来的娱乐是AI娱乐

6月9日,爱奇艺世界·大会第二天,汤兴博士分享了爱奇艺的技术战略及布局,并正式公布设立创新实验室,将通过国际合作制定视频行业的AI标准,引领AI娱乐时代的视频行业变革。这也将是爱奇艺“做一家以科技创新为驱动的伟大娱乐公司”的愿景得以实现地坚实一步。

汤兴在主题演讲中结合爱奇艺的创新实践,详细阐释了AI对于视频网站的价值。“海量的内容、用户、以及强大的云计算能力促进了快速迭代到AI娱乐时代的进程。”汤兴表示,爱奇艺今天的数据量相当于十年前全球网站流量总和。在七年的发展历程中,爱奇艺始终重视数据的价值,不断利用新技术探索视频网站的边界,努力提升用户体验,并凭此吸引着更多用户,搭建了以技术为驱动的AI娱乐生态。

爱奇艺很早便开始了AI技术的布局,作为连接内容和用户的中间桥梁,全方位解析两端的数据,让AI技术在内容端辅助视频创作,在用户端提供创新的应用和个性化的服务,同时提升网站的运营效率。经过持续的探索,爱奇艺开发了多个以AI技术驱动的创新应用,在提升用户体验的同时,拓展了商业化的空间。利用自然语言处理、图形图像识别技术,解析网站视频、图像、文本信息,能全面提升网站的智能化。

汤兴表示:“对每个娱乐公司来说,内容和用户永远是一个二元体,我们既要理解内容,同时也要理解用户,这也是与传统媒体和新媒体最大的区别,我们能够给用户更多的选择以及更多的交互的方式。”

互联网思维的核心是确保用户体验,在爱奇艺的视频平台上,为每一个用户提供差异化的服务是爱奇艺一直努力的方向。但是,在这个领域,给视频起标题可并不像想象的那么简单。

首先,需要理解视频内容,还需要对整个视频进行思维概括和抽象的能力。在去给视频起标题之前,可能需要事先了解的就是这个视频内容,进一步进行切分,并对这些视频标注一些智能化的标签,让用户理解这个视频究竟是属于哪个分类,是关于什么的。而这其实是后期个性化视频推荐最坚实的基础。

此外,未来AI还将辅助内容创作者来创作内容。汤兴表示:“我们知道匠心不可复制,但是优质的内容通过AI可以帮它挑选出真正优秀的情节。”据介绍,爱奇艺通过独有的滤镜技术,将用户的播放量、互动量、整个社交传播的方式,包括对明星、场景的分析,自动的把优秀的片断提取出来,并打上智能标签,通过用户观看行为后期的范围,以及语义分析能够自动生成短视频。

不仅如此,利用AI技术,汤兴连接内容和用户,提出了“AI艺术家”的概念,开发了“智能剪辑”功能,能让系统找到长视频中具有价值的剧情点。还开发了神奇的”三维换脸“功能,通过人脸建模让任何人都能成为”演员“。

在用户端,通过分析用户行为数据,爱奇艺得以全面了解用户,更好地进行舆情分析、个性化推荐,以及受众洞察。汤兴介绍道:“我们通过用户大量的行为,包括消费充值、互动、搜索播放,通过意图识别、行为建模和机器学习最终进行了完善的舆情分析,通过给用户推荐个性化的内容和相应的反馈,并模拟出了精准的用户画像。”

值得一提的是,利用深度学习等技术,爱奇艺开发了一套具备票房、流量、收入等预测能力的商业智能系统,辅助影视投资和版权采买行为,极大的保证了投资回报率。得益于对AI技术的深度挖掘,爱奇艺提升了产品体验,并打通了内容端、用户端的产业链资源,实现合作共荣。

以下是演讲实录:

大家好!欢迎大家光临爱奇艺世界大会智能视频分论坛。我今天的演讲主题是“AI娱乐”。我们知道,现在回顾整个数字化娱乐的演进史,从最早的VCR、DVD,到数字视频的下载,到PC互联网时代,到最近移动互联网时代,整个数字视频的演进史也代表了整个数字化娱乐的演进史。那么,随着内容的极大丰富,用户量的极大增加,下一代娱乐会向哪里发展?我们认为是未来的AI娱乐。
我们看一下这个数字娱乐的演进史,它体现出来的几个最重要的特征。

第一,内容的极大丰富。我们知道以前的传统媒体用户只能去被动的接受,现在用户有了更加多的选择,无论是内容丰富的形式:从直播到点播,到图文,到长图文,到投票,到话题,包括整个网大、网剧、电影,也有各种各样新的创业方式,导致内容变成了海量。同时,在这个过程中,用户接受内容的方式也有了很大的变迁。最早我们接受内容的方式基本上都是通过内容被动的push,电视台放什么节目,媒体放什么文章,我们会去接受什么样的内容。现在需要更多的个性化,需要在浩瀚的内容海洋当中去找寻。同时现在的形态也越来越多,无论是VR、AR,还是4K,包括杜比全景声,各种创新的内容形态也越来越多。同时,我们解决了以前很难解决的一个问题,最早的传统媒体的变现方式都是通过传统的品牌广告,传统的基于内容的CPD的广告,而现在我们通过信息流广告的形式,其实我们打开了以前一扇变现的大门。以前传统的、浩瀚的,以短视频为主的垃圾流量可以变现,变成一个真正的金矿。

那么,爱奇艺其实在这次的世界大会重新更新了我们的企业愿景,我们说要做一家以科技创新为驱动的伟大的娱乐公司。那么,科技创新怎么样驱动一家娱乐公司?我们知道,现在在移动互联网时代,爱奇艺已经变成了整个领域的第一名,我们每天移动端的DAU,上个月的数据,昨天龚总都已经公布了,在整个中国的移动互联网领域我们是毫无疑问的第一名。同时,我们整个月度的DAU,在整个视频行业排名第一;整个时长在中国互联网排名第二,仅次于微信。同时,其实可能大家还有一个不知道的,经过两年的默默耕耘,爱奇艺上的泡泡社区也变成最大的娱乐的粉丝社区,目前DAU已经达到6000万。

那么,随着这么大的海量的用户,那么长的时长和海量的粉丝,我们如何以海量的内容、用户,以强大的云计算能力促进AI时代的发展。爱奇艺走在了行业的前端。

但是,同时我们认识到,对每个娱乐公司来说,内容和用户永远是一个二元体,我们既要理解内容,同时要理解用户,而传统媒体和新媒体最大的区别是我们能够给用户更多的选择,能够给用户更多的交互的方式。那么,我们真正认识到,科技只有和人文、艺术相结合才能绽放它的生命力。

下面让我和大家一起回顾一下爱奇艺这几年在AI方面所做的所有工作。

我们知道AI所有核心是为了理解内容,理解用户,同时通过运营,把二元体融为一体。那么,爱奇艺由于有了庞大的内容,又有海量用户的行为,让我们通过智能理解用户的行为和意图,以及智能地理解内容来更好的创作更多的内容,更好的服务用户,同时也能更好的提升我们的运营效率。下面我会通过内容、用户、运营效率方面阐述我们在智能行业做的这些工作。

我们知道整个互联网的发展是从文本开始的,对人的交互来说,文本是一个最简单的方式,更多的现在用户的交互还是通过键盘,通过鼠标。首先,我们要理解用户文本的输入。

首先,我们看这个例子,“鹿晗演绎帅气陈长生,逆天改命择天记终迎结局”,我们知道陈长生是鹿晗演的一个角色,择天记是一个剧的名字,爱奇艺的大脑真正能够以人类的方式理解这句话,从而能够在搜索中给出用户真正想要的结果。那么,通过对文本分析的理解,在爱奇艺的搜索引擎里面你是可以搜这样的词语的,搜索李晨女友演过的电影是哪些,都是范冰冰演的。当我们理解完文本之后,接下来对我们最大的挑战其实是理解视频本身。我们知道视频是由镜头组成的,电影的拍摄模式是导演拍摄不同的镜头,做不同的组合。反过来当我们理解这个视频的时候,我们要把视频分解成不同的镜头,每个镜头分解成不同的画面,以此真正理解这个视频本身。

首先大家耳闻目染的就是人脸识别,这个在各个行业都非常多的应用,我们也做了关于娱乐、人物所有的人脸识别。但是,随之衍生的因为通过镜头的理解和切割,通过各种不同镜头之间的关系,当人脸被遮挡,或者人在背过身去,或者在昏暗环境时候我们的镜头识别,我们依然可以追踪一个演员,它有什么用处?我们有一个新的产品会上线,我们能够让一个用户在视频里只看某一个演员出现的场景,能够分析出电视剧中每一部剧这个人出现的时长,由此你能知道当前戏份最长的演员是谁,每个用户观看他的时长是多久。

同样,我们能够分析每个人的一些属性,无论他的高矮、胖瘦、发型、性别,这样我们可以对人群做一个区分,以及可以用来做后续的商业。当然人有七情六欲,当我们用机器理解人的时候首先要理解他的七情,当然我们不希望他有六欲。爱奇艺在情感识别上也花了很大的工作,我们团队在去年两次国际的顶尖的情感大赛上获得了桂冠。我们可以识别他高兴、恐惧、惊讶、悲伤、生气,甚至可以进而识别他的所有行为,他在拥抱,还是在亲吻,还是在跳舞,还是在吃饭,还是在化妆,我们通过这种行为分析,把原来分布在各个地方关于某个人的各种行为融为一体诞生一个新的视频,这是后面我要讲的AI如何辅助内容的创作。除了我刚才所说的,甚至还有他所处的场景和地点,这个可以用来做旅游相关的导购,包括时间,包括天气,甚至刚刚发布了对白的识别。

爱奇艺可以通过AI技术的帮助让整个爱奇艺视频搜索变成全世界最大的中文视频搜索引擎,我们每天的分发量超过3亿。我们第一次发布了以图搜剧的功能,今天在爱奇艺可以直接把这个图片输进去,或者拍下来,能够直接找到这个图片出现的影片以及出现的时间戳,点进去之后可以从这个时间戳开始观看,目前我们已经收录了超过4万小时的电影、电视剧、综艺等视频内容,当然你也可以说我们去搜索经典的台词,像以前《大话西游》里经典的台词。

那么,随着AI对内容的理解,使我们进一步可以对视频进行一个描述。因为我们知道最难的是什么?现在在这个行业最难的是给一个视频起标题。因为它不光需要你去理解视频内容,还需要你要有整个概括思维和抽象的能力。在去给视频起标题之前,可能需要事先了解的就是这个视频内容,进一步的开始切分,给它打一些智能化的标签,让你理解这个视频究竟是属于哪个分类,是关于什么的。而这其实是后期个性化视频推荐最坚实的基础。

现在在爱奇艺有一个成熟化的标签标注系统,通过把视频进行镜头的拆分,然后对镜头进行进一步的分类,然后进行我刚才所说的各种属性的识别,从此生成一个标签的各种识别,然后进行测试,给每个标签打上执行度,以此对后期的所有工作打下坚实的基础。下面看一个视频,这个绿色的是当前执行度最高的标签,它会自动识别出当前这个场景里最重要的标签是什么,以及这个标签的执行度相对其他标签哪一个更加可靠。

我们知道当我们识别了一个视频之后,我们需要理解的是用户,因为每个用户会喜欢不同的视频,尤其现在短视频开始爆发,当内容海量的情况下,人的消耗,整个视频的时长几乎是固定的。那么,每个爱奇艺的用户几乎在爱奇艺每天会消耗大概100-150分钟。当他的时长固定的时候,他需要更多的是去消费他感兴趣的内容,而不希望把时间花费在他对内容的寻找上。那么,我们通过用户大量的行为,包括他的消费充值、互动、搜索播放,通过意图识别,行为建模和机器学习最终进行了完善的舆情分析,通过给用户推荐个性化的内容和相应的反馈,我们最终也模拟出了精准的用户画像。

这次我们也会发布一个新的爱奇艺的产品叫“爱奇艺指数”。通过“爱奇艺指数”你可以看到所有内容在爱奇艺上播放的数据的整体分类和挖掘的情况。我们看一个例子,《欢乐颂》,首先可以看到播放量的分布,在移动端占比多少,在PC端占比多少。也可以看到整个地域的分布,到底哪个地区的人更喜欢看这部影片。同时经过AI标签的分析,能够知道在这部电视剧里面哪一个场景出现得最多,我们也能知道用户最喜欢的是哪些场景。

同时,我们能够知道每个明星在这部视频中出现的时长,而它真正反映了用户对这个明星的感知到底有多长。由此诞生了另外一个产品——明星排行榜。我们不光要分析用户的观看数据和整个互动数据,我们还希望知道他在社交网络中对这个内容的评价,以及他们关心的着重点,我们有相应的舆情分析的工具。比如《欢乐颂》,大家更关心樊胜美、小曲、安迪,这些舆情的分析能够帮助内容创作者和宣发的工作人员进行有效的人群的定向和内容的宣发。现在我们把“爱奇艺指数”会集中在爱奇艺号的平台中,未来所有的内容生产者都可以通过这个指数看到所有内容消费的情况。

还有关于观众的分析,直接过了。前面讲的都是理解内容,后面我们讲的是创作,传统的艺术家创作内容是通过对用户的理解选择符合这个用户群的内容。同时,当他创作出内容之后让用户来消费。那么,未来AI如何辅助内容创作者来创作内容是我们需要研究的方向。我们知道匠心不可复制,但是优质的内容通过AI可以帮它挑选出真正优秀的情节。在短视频爆发的时代,怎么从原来浩瀚的长视频中挑选出用户真的感兴趣的短视频推给用户,现在非常火的是5分钟看一部电影,3分钟看一个故事,未来怎么自动化的产生这些短视频,因为我们知道短视频的产生需要很强的制作能力。我们有浩瀚的长视频内容,爱奇艺有独有的滤镜技术,通过对用户的播放量,互动量,整个社交传播的方式,包括对明星,对场景的分析,可以自动的把优秀的片断提取出来,通过给它打上智能标签,通过用户观看行为后期的范围,以及语义分析能够自动生成短视频。

同时,我们也生成了一些好玩的东西,在泡泡社区里,很多人都有当明星的梦,利用3D建模上传一张照片。我们知道内容的采购和创作,以及它的宣发影响了最终内容整个的变现成本。那么,爱奇艺在内容采购中很早以前就做了很多工作,我们怎么样通过我们对流量的预测来辅助我们的采买人员买更精准的剧。这也导致了爱奇艺我们内容的采买在行业中是领先的。同时,当你采购来一个剧的时候怎么做宣发直接有效,是铺天盖地的铺户外广告,还是社交网络传播,还是精准的在社会群体中进行传播,我们会有精准的娱乐分析和舆情分析帮助他们做决策,同时事后我们可以分析这个视频到底哪个环节做得好还是不好。

看VV预测,基于深度学习的多时间窗口。另外,我们也知道数据是一个平台的生命,而数据的真实性其实是一个视频平台、一个娱乐平台存在的根本。因为各种各样的原因,这个行业总是会出现一些作弊的流量,我们2014年开始建立了强大的反作弊系统,通过实时防控系统,然后到后期的异常流量的在线和线下异常流量的清楚,我们保证了这个平台的真实性。

我刚才讲的是我们在内容、用户,以及我们在相应的运营手段中所做的所有工作,怎么样通过AI真正帮助视频行业改变以前以人为主的运营方式、以人为主的创作方式,和以人为主的理解方式。今天在所有的部门中我们被称为爱奇艺大脑,我们通过和很多业界一流的机构和合作伙伴的合作,包括百度、英特尔、自动化所、中科大、杜比、Media,包括山东大学的合作,在视频的ARP文字理解,视频本身,音频的理解,过一会儿John  Couling也会讲一下杜比在音频方面的工作,同时在商业技能方面的发展,我们在更加地促进AI在整个娱乐行业中的发展。

我们知道AI最强的需求是第一要有强大的数据;第二,要有强大的计算量;第三,要有真实的行业的前景。AI最终一定要通过行业落地,爱奇艺希望我们在AI方面的工作能够沉浸在整个在娱乐方面的工作过程中,借此我们也成立了爱奇艺创新实验室,把整个爱奇艺的音频、视频、商业智能、文本的研发团队合为一体,同时通过和业界各方面的合作,我们希望这个创新实验室能够变成整个娱乐AI方面工作的一个推动力,能够推动整个娱乐行业向AI娱乐发展。

我们通过AI让机器有了理解人的能力,让机器有了温度。同时,我们也通过AI让爱奇艺更加的了解我们的用户,让爱奇艺更加了解用户的情感,让爱奇艺更加有温度。那么,未来我们希望AI能让爱奇艺变成一个更加善良有温度的娱乐平台,能够让更多的用户在爱奇艺上找到消费、互动,他们最喜欢的视频,爱奇艺,爱娱乐,我今天的演讲到此为止,谢谢大家!


 

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题