科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道互联网金山云打造AI黑科技:集智高清创造视频新体验

金山云打造AI黑科技:集智高清创造视频新体验

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

对于国内的移动视频用户来说,从2015年到现在,可谓是“视界大开”,VR、短视频、移动直播纷至沓来,移动视频的广阔前景让人们浮想联翩,也成就了一个又一个的商业传奇。

来源:至顶网软件频道2018-10-22 13:50:39

关键字:

  • 评论
  • 分享微博
  • 分享邮件

至顶网软件频道消息:对于国内的移动视频用户来说,从2015年到现在,可谓是“视界大开”,VR、短视频、移动直播纷至沓来,移动视频的广阔前景让人们浮想联翩,也成就了一个又一个的商业传奇。

视频云服务在其中功不可没,其不断降低移动视频的准入门槛,让视频与各行各业的融合成为常态。与此同时,随着移动终端的升级和网络环境的改变,用户对视频的上传和播放提出了更高要求,产生了新的痛点。对此,在最近的LiveVideoStackCon 2018音视频技术大会上,金山云高级总监武爱敏发表主题演讲,与听众分享了目前如火如荼的人工智能技术,是如何为金山云的视频云服务赋能,解决视频行业痛点的。

金山云高级总监武爱敏发表主题演讲

人工智能:破除视频业痛点的利器

视频行业的繁荣,催生了专业化的服务,云服务商的入场就是典型的例子。从早期的存储、CDN,到现在的大数据、人工智能,服务内容的多样化,让视频行业企业专注于自身的核心业务,更加灵活地应对行业变化。

但这并不代表视频行业可高枕无忧,行业的三个痛点仍然待解。首先,内容越来越丰富、清晰度不断提升,使得用户对观看体验的要求近乎无止境,高画质、零卡顿、超低延时、安全稳定......有数据显示,遇到视频播放卡顿或加载时间太长,66%的用户会直接退出当前的播放,严重的卡顿会使用户的满意程度从接近满分跌到几乎为零。

第二,对于视频行业而言,带宽是无法忽视的问题。昂贵的带宽费用,让许许多多想在视频行业一展拳脚的公司望而却步,对于视频行业巨头来说,从他们的成本结构中可以看到,带宽成本如果居高不下,长期处于“烧钱”状态,也会对他们在行业中的口碑和地位造成影响。

第三,视频行业有着非常丰富的内容,但同时也有着内容的红线。为了确保平台上的内容不会出现有害信息,视频平台需要对内容进行严格审核,完善内容管控机制,改善内容推荐算法,这也需要耗费大量人力成本。

这些痛点需要依靠技术上的不断突破才能缓解。“依靠算法、算力和大数据支撑的人工智能技术,将成为赋能视频云、解决视频行业客户痛点的重要工具”,武爱敏表示。

四大黑科技加持金山云集智高清

“一直以来,金山云通过不断加大人工智能技术的研发投入,推动相关的应用不断落地”,武爱敏介绍了金山云最新推出的集智高清(Kingsoft smart high definition,简称KSHD),“集智高清围绕人眼结构特性,将编码、图像处理和人工智能进行整合,通过自研算法和深度神经网络,对视频内容进行感知,为客户节省20%—40%视频传输带宽,为用户带来更好的视觉感受”。

集智高清之所以能够提升视觉效果,为客户节省成本,是因为有四大黑科技加持,首先是灯光建模。由于我国的用电频率是50Hz,灯光频闪很难完全避免。人眼的视锥细胞负责感光,视锥细胞在经历一次刺激之后,无法对二次刺激产生反应。

但对室内场景来说,多光源的频闪照射到物体上引起的反射,将会对视频编码带来极大的负担。集智高清的研发团队对室内光源位置进行建模,将人眼感受不到的灯光和反光消除,将纹理保存下来,帮助直播平台节省更多带宽。

第二,画质增强。人眼的视锥细胞负责感受亮视觉,视杆细胞负责感受暗视觉,在明暗转换过程中,细胞的激活需要时间。针对人眼对光的感受特性,集智高清提供了多种模型进行画质增强,包括暗场增强、细节恢复、去除拍摄或压缩产生的噪声、超分辨率等等,并将最优结果进行融合操作,实现用户无感知下对各种不同场景的自动应对。

第三,视频聚焦。集智高清的ROI处理技术,可根据人眼最敏感最关注的内容做视觉感知保护,实现画质增强的同时节省至少20%的带宽。

第四,恰可感知失真。人眼视觉系统能够适应的光强度(朗伯)级别范围很宽,从暗阈值到强闪光阈值可以达到10的10次方量级。然而,当背景光保持恒定的时候,人眼能够感受到的范围是有限的,典型的观察者可以分辨总共12级到24级的不同光强度变化,而观察者可以分辨的级数会根据其环境光源强度、高频/低频区域有着很大的差异。通过大量的统计建模,集智高清集成了最符合人眼视觉系统的恰可感知失真技术,可以做到同画质下节省5%—25%的码率。

破除技术和成本壁垒,更好应对需求

有了黑科技的护持,集智高清在游戏、体育赛事、秀场直播以及VR、短视频等多种场景和形态上,有着广泛的应用。在视频场景识别方面,集智高清针对游戏、新闻、秀场、动漫、体育、短视频等多种类型内容,分别建立视频模型,以便根据不同的视频场景进行分类实时识别,根据不同场景的识别结果,配置适合此类场景的编码参数,根据纹理和运动变化幅度等,选择最优编码模板参数。

在视频场景分类上,集智高清通过深度学习,形成了十余大类,几十种小类视频场景模型库。客户在使用集智高清服务时,可实时分析直播流,匹配相应的视频场景模型,根据客户对视频画质的要求,对画质进行实时处理。

“我们希望集智高清能够成为视频行业的加速器,为客户的业务创新和行业的技术演进贡献力量”,武爱敏表示,视频云服务受到移动视频行业的驱动,但是反过来也能促进移动视频行业的繁荣,金山云作为视频云服务的领军企业,将帮助客户更好应对移动视频日益复杂多样的场景和需求,破除技术和成本壁垒,帮助客户建立竞争优势,为用户提供更加多元化和个性化的服务。

科技行者:每条内容都是头条的新闻客户端 扫码立即下载

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    相关文章
    最新文章