至顶网软件频道消息:NEX作为vivo的创新之作,一经推出即以升降式摄像头、全面屏发声技术吸引了人们的眼球。近期,全球首款双屏三摄旗舰vivo NEX双屏版的发布,以“未来不止一面”完美诠释了手机科技创新无限的精神;与这种创新相呼应,全球领先的人工智能平台公司商汤科技SenseTime同样为此款产品注入了领先行业的人脸3D技术,在NEX双屏版3D焕颜相机中,商汤科技为其提供的SenseMatrix人脸3D重建及微整形两大尖端黑科技,让美颜从此立体,相机3D美颜新时代已来临。
注:图为发布会现场观众体验3D焕颜相机
SenseMatrix人脸3D技术蜚声业界,不止探索“美”一面
随着“无美颜、不自拍”成为众多年轻男女手机拍照的铁杆定律,商汤科技带来的3D美颜在短时间内构建仿真人脸模型的新颖性,以及针对仿真人脸进行五官灵活调节的强互动性与娱乐性,无疑引领了当下年轻群体自拍体验新潮流。
自上半年落地以来,商汤科技SenseMatrix人脸3D重建技术以其更加真实、立体的美颜效果蜚声业界,基于商汤科技在人脸关键点算法的多年积累与打磨,SenseMatrix人脸3D重建技术能依据多帧RGB图像和深度信息输出对应的全角度人脸3D模型,本地操作、无需连网即可完成建模流程的复杂算法运算,具有领先行业的可测量、可编辑、实时渲染、场景适应性更高等多重优势。
注:图为SenseMatrix人脸3D重建过程示意
经过不断迭代以及对重建效果的持续优化,商汤科技此次在NEX双屏版上正式发布了人脸3D重建升级功能——人脸3D微整形。当用户在使用3D焕颜相机时,可以对3D重建后的脸部、脸颊、额头、下巴、眼睛、鼻子等多点部位联动式调节,从而实现个性化的自定义微整形效果。从“重建”到“微整形”,3D美颜的层次上升到了新的高度,当商汤科技3D视觉技术融入vivo对美颜拍照的美感追求时,用户的“美”一面都可以在3D焕颜相机中尽情探索。
注:图为SenseMatrix人脸3D微整形部分示意
超强算法适应性,商汤3D视觉技术推动AI赋能升级
当3D摄像头进入旗舰机型成为手机厂商尝鲜的第一步,如何在此基础上探索出给用户带来惊喜体验的3D应用则考验着每一家算法提供商;而各类3D模组间诸如原理、有效深度范围、深度质量等存在差异,更是使得算法适配难度增大。基于强大的底层技术实力,商汤做到了算法在不同3D模组间的完美适配。得益于上半年在3D结构光中实现人脸3D重建所带来的技术积累与手机端落地经验,本次商汤于TOF模组上实现的人脸3D重建与人脸3D微整形有了更好的效果展现,通过算法的优化,一方面弥补了模组本身深度信息的缺失,达到高水平还原人脸3D细节;另一方面,进一步提升了高清纹理,使得3D重建的人像清晰度提升了4倍。
商汤科技SenseMatrix人脸3D重建技术对行业两大主流3D模组的无缝适配,推动了AI技术在手机领域的进一步落地,也为手机厂商的长远技术路线规划奠定了坚实的基础。作为全球领先的人工智能平台公司,商汤科技不断拓展算法边界,在人脸3D视觉技术领域的精益求精,也使其成为众多移动终端厂商在AI领域的合作伙伴首选。
现在,商汤科技正在策马奔腾,不断创新包括3D智能视觉技术在内的AI算法,赋予智能手机新的活力。未来,商汤将继续拱筑AI能力“护城河”,持续推动技术革新,为移动互联网领域更深层赋能,成为中国智能手机在全球市场竞争中的强大助力。
关于商汤科技
作为全球领先的人工智能平台公司,商汤科技SenseTime为中国科技部指定的国家新一代人工智能“智能视觉”开放创新平台(其它四个国家AI平台分别为阿里巴巴、百度、腾讯、科大讯飞)。同时,商汤科技也是“全球最具价值的AI创新企业”, 总融资额、估值等在行业均遥遥领先。
商汤科技以“坚持原创,让AI引领人类进步”为使命。公司建立了全球顶级、自主研发的深度学习平台和超算中心,并且研发了一系列AI技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。因此,商汤成为中国最大的AI算法提供商。
商汤科技的市场占有率居多个垂直领域首位,涵盖智慧城市、智能手机、互动娱乐及广告、汽车、金融、零售、教育、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的公司和机构建立合作,包括美国麻省理工学院、高通、英伟达、本田、阿里巴巴、苏宁、中国移动、银联、万达、华为、小米、OPPO、vivo、微博等。
商汤科技现已在香港、北京、深圳、上海、成都、杭州、京都、东京和新加坡成立分部。更多信息,请访问商汤科技网站、微信和微博。
好文章,需要你的鼓励
研究显示,英国中小企业虽占企业总数99.9%,但因资源与专业不足,难以有效应对网络攻击。CyCOS项目旨在通过构建支持社区,帮助中小企业提升网络防御能力。
这项研究提出了一种名为"词汇偏向水印"(LBW)的新方法,专为自回归图像生成模型设计,能够抵抗传统水印技术容易被删除的重生成攻击。研究团队将代币库分为绿色和红色列表,通过软硬两种偏向策略鼓励模型在生成过程中选择绿色列表中的代币,并采用多绿色列表策略增强安全性。实验表明,LBW在多种攻击下展现出卓越的稳健性,尤其是在面对重生成攻击时表现突出,为AI生成内容的可追溯性提供了更可靠的技术保障。
Wispr 的 Flow 是一款创新的 iOS 语音输入软件,借助 AI 技术能将语音无缝转换为精美文字,每周免费 2000 字,支持 100 多种语言,并能实现多设备同步。
南方科技大学林剑满团队开创性提出DGAD模型,解决通用物体组合中几何编辑与外观保持的双重挑战。该方法首先利用语义嵌入隐式捕捉物体几何特性,再通过密集交叉注意力机制精确对齐外观特征,成功实现物体在任意场景中的灵活编辑同时保持细节不变。实验表明,DGAD在编辑灵活性和外观保真度上均优于现有技术,为AR/VR内容创建等应用提供了强大工具。