至顶网软件频道消息:如今,视频行业已进入爆炸式发展的时代,4K、AR、VR、人工智能这些词汇,已被人们越来越多地提及。行业的爆发与快速迭代,为视频云服务的发展提供了充足的推动力,这也进一步促进了视频行业的繁荣。
视频行业和视频云服务如何走上更加广阔的舞台?11月30日,在第六届中国网络视听大会由金山云承办的“AI赋能 俯瞰视界”人工智能应用发展论坛上,金山云CDN及视频云产品中心总经理宗劼发表了主题演讲。宗劼表示,在视频行业呈现出直播互动、人工智能、AR/VR、高清四大趋势的作用下,视频云服务将呈现传输深度边缘化、视频业务全云化、智能化、边缘计算化四大趋势。作为视频云服务领军企业,金山云将顺应趋势,通过深耕视频行业,打造更优质的产品和服务,为更多应用领域赋能。
金山云CDN及视频云产品中心总经理宗劼发表主题演讲
视频行业呈现四大趋势 云服务迎新机遇
中国互联网络信息中心(CNNIC)的数据显示,截至2018年6月,中国网络视频用户规模达6.09亿,占网民总体的76.0%。手机网络视频用户规模达到5.78亿,占手机网民的73.4%。这说明,视频已成为人们生活的一部分。
行业的火热是技术进步的推动力。宗劼表示,视频行业已呈现四大趋势。第一大趋势是互动。直播作为即时性强的娱乐形式,互动是其天然自带的特性,连麦、问答、抓娃娃......主播均会与观众形成互动。
第二大趋势,人工智能。人工智能是整个视频行业的未来,机器学习、图像识别、内容选择、内容分析等,都是人工智能与视频结合的典型应用。
第三大趋势,AR/VR。近年来,AR、VR行业快速发展,随着主流标准制定和技术的成熟,AR、VR势必会在更多应用场景落地。
第四大趋势,高清。随着硬件设备的处理能力增强,1080P、2K、4K,视频高清化将持续升温。高清需求的增加,对互联网的业务支撑能力和带宽的需求将井喷。
“技术的进步对云服务提出了更高要求”,宗劼表示,如今在线视频的应用场景日益复杂多样,云服务商应该通过深耕行业,挖掘用户的个性化需求,提供有针对性的增值服务,从而帮助视频平台建立竞争壁垒。
视频云四大趋势赋能更多应用领域
在视频行业四大趋势作用下,视频云服务同样将呈现出四大趋势,分别是传输深度边缘化、视频业务全云化、智能化、边缘计算化。金山云将顺应这些行业趋势,不断将最新技术引入视频行业,围绕视频这一核心,辐射特色服务。
第一大趋势是传输深度边缘化。受限于传统网络分布和传输技术问题,比如在高峰期时,比如在西北、西南地区,网络传输的效率和速度极大影响体验。金山云联合小米共同推出“一公里边缘计算”解决方案,利用边缘计算技术,解决长期困扰业界的从CDN节点到WiFi终端之间最后一公里的网络速度和安全问题,打造距离用户最近的边缘计算,解决网络拥堵和劫持,相比传统CDN网络,能够将全网整体速度提升30%。宗劼表示,“我们希望通过传输深度边缘化,让视频流量的传输管道深入到每个家庭的终端,更加高效地运转,更好为用户服务”。
第二大趋势是视频业务全云化。在视频的处理方面,除了CDN以外,包括源站、编解码、AI处理、流媒体传输和交互式通讯等都将上云。同时,包括主机、存储在内的视频配套业务也将上云,从而帮助客户进一步提升效率,让业务更快上线,更好提升稳定性。
第三大趋势是智能化。通过在视频和人工智能领域的实践和探索,金山云相继推出三大AI产品——KIE、集智高清和“金睛”平台,帮助视频平台实现内容AI化,优化用户体验、降低运营成本、保障内容安全,带来高清视觉体验,最大程度上节省传输成本。
第四大趋势是边缘计算化。如视频AI、视频转码、低延时直播、声音识别,将呈现出“边缘化”特征。对于低延时直播,边缘计算能够将原来的几十毫秒的延时,降低到十毫秒以内。视频AI经过边缘计算技术的处理,能够降低中心机房带宽传输的压力,实现成本的大量节省和体验的大幅提升。
“顺应视频云的技术趋势,我们能够赋能更多的应用领域,包括OTT、IoT、网络购物、音视频通讯等”,宗劼表示,金山云将坚持客户需求为导向,融合创新技术,帮助视频平台拓展市场空间,以效率提升和价值创造推动行业发展。
好文章,需要你的鼓励
这项研究介绍了CRAWLDoc,一种创新的文献排序系统,能从网络中自动识别与学术论文相关的文档。德国乌尔姆大学的研究团队利用小型语言模型,将论文登陆页面作为查询,对所有链接资源进行排序,有效解决了学术元数据提取面临的网页布局多样性问题。基于600篇来自六大出版商的论文测试,系统展现出卓越的排序性能和跨出版商适应能力,为改进学术信息提取奠定了基础。
西安交通大学与昆明理工大学研究团队开发了一种基于集成学习的婴幼儿语音情感识别方法,能有效分辨饥饿、困倦、不舒服和高兴四种情绪状态。研究采用三层分类器架构,整合SVM、随机森林和KNN算法,达到85.82%的准确率,显著优于单一分类器。这项技术有望应用于智能婴儿监护和早期疾病筛查,为理解婴幼儿非语言表达开辟了新途径。
这项来自普渡大学和微软的研究探索如何让AI助手更好地保护用户隐私。研究团队通过让大型语言模型在回答前先思考"语境完整性"(即在特定场景下什么信息适合分享),并结合强化学习技术进行训练,成功降低了隐私信息泄露风险高达40%,同时保持了任务完成能力。研究仅使用约700个合成数据样本进行训练,却在真实场景测试中展现出色效果,为构建更隐私友好的AI助手提供了实用方法。
SkyReels-Audio是Skywork AI团队开发的全能音频驱动人像视频生成框架,能将静态图像或视频与语音输入结合,生成高度逼真、唇形同步的说话人像视频。基于预训练的视频扩散变换器构建,该技术支持无限长度视频生成和编辑,提供多模态控制能力。通过混合课程学习策略和双向潜在融合技术,该模型在身份一致性、面部表情自然度和唇形同步精度上取得了突破性进展,为数字内容创作、教育和娱乐领域带来革命性可能。