无论是电商领域,虚拟数字人化身虚拟主播、客服,创新购物体验,提升平台效率;还是文旅领域,虚拟数字人扮演者导游角色,丰富旅行体验,注入产业新活力;或是影视领域,担任特效角色、虚拟偶像,营造逼真视觉的虚拟数字人,开创了娱乐的新形式......
当前,虚拟数字人行业得益于生成式AI、实时渲染、动作捕捉和语音合成等技术的进步,正在迅速发展和变革在多个应用场景,展现出广泛的应用潜力和实际价值。
在生成式AI问世之前,虚拟数字人的发展可谓历经坎坷。高昂的制作成本和技术门槛让许多企业望而却步,建模、动画和渲染过程复杂且耗时,且传统虚拟数字人的互动体验单一,主要依赖预设脚本和动画,显得机械且不自然;虚拟数字人的应用场景有限,多集中在娱乐和广告领域,难以在教育、医疗和企业服务等其他行业中普及。
正因如此,虚拟数字人的普及和商业化应用受到极大限制。而近几年来,随着生成式AI提高了虚拟数字人的交互能力,推动着虚拟数字人在现有应用场景中的更深入应用,虚拟数字人如雨后春笋一般涌现,成为各行业的“宠儿”。
东风——虚拟数字人的“AI”之变
对于作为虚拟数字人企业的北京海百川科技(以下简称“海百川科技”)而言,当生成式AI时代的东风吹过,便为其开启了一场蜕变。
从娱乐、电商,到企业服务和医疗健康,再到智慧城市。现在,海百川科技的虚拟数字人产品和服务,在生成式AI加持下正深入各个领域。更是推出了虚拟偶像、虚拟演员、虚拟导购、虚拟主播、虚拟客服、虚拟导览;AI摄像师、AI画师和AI剪辑师等数字人形态产品等多种解决方案。
虚拟人背后的现实能力,来源于“图灵九歌大模型”中台系统,凭借多模态智能内容生成与交互模型的能力,能够将技术与数据转化为各行各业的“AI员工”促进企业提高工作流效率,通过整合最前沿的人工智能技术,为企业提供高效、精准的智能内容生成和互动解决方案。
北京海百川科技联合创始人、副总经理 杨星蕊
北京海百川科技联合创始人、副总经理杨星蕊解释说,“图灵九歌大模型”融合了海百川科技自研的TURING GANS深度学习算法和TURING VAE大数据处理技术,能够快速构建并优化各类模型,为企业提供强有力的智能化转型支持。
除了技术上的创新,海百川科技的前期积累也是强有力的支撑。
其实,早在2014年,海百川科技旗下的“AI Star”就开始研发AI换脸相关技术,并建立了较成熟的算法模型。
到2019年,国内掀起了“AI换脸”风潮,海百川科技便顺理成章地在这一时期立在潮头。
当称之为元宇宙“元年”的2021年到来,海百川科技用便开始用AI算法生成虚拟形象,进行直播互动、拍摄写真及短视频。
基于多年积累的丰富语料库和数字人资产库,让海百川科技为虚拟数字人提供了多样化的知识基础和语言表达能力。同时,海百川科技还通过整合OpenAI行业领先的开源大模型,增强虚拟数字人的语言理解和生成能力。“这些开源模型经过广泛的数据训练,具备强大的通用性和灵活性,能够处理复杂的语言任务。”杨星蕊强调。
这种半开源半自研的策略,使海百川科技在生成式AI和虚拟数字人的融合之路上走的更加顺畅。
模式——虚拟数字人开辟多元新场景
现在,海百川科技凭借其虚拟数字人技术,在娱乐、教育、文化旅游、先进制造业及数字内容创作领域开辟了新天地,彻底改变了其传统服务模式,推动了个性化和智能化服务的发展。
在娱乐领域,海百川科技的虚拟偶像和演员正通过AI和动作捕捉技术,为观众带来沉浸式体验。杨星蕊直言:“我们的目标是通过高科技手段减少影视制作成本,同时提升视觉效果的真实性。”
在教育行业,海百川科技与高校的合作中,开发了虚拟慕课系统。虚拟教师能够根据学生的学习进度提供个性化辅导,从而提高教学质量。杨星蕊解释说:“这种技术的应用,使得技术探索和创新教育更加容易。”
这两年火热的文旅领域也不例外,在福建的茶叶元宇宙项目中,海百川科技的虚拟导览角色不仅提供实时信息,还增加了与游客的互动性。“通过虚拟技术,我们能够重现历史文化,增强游客的文化体验,”杨星蕊坦言。
在先进制造业和数字内容创作领域,也能看到海百川科技的虚拟数字人技术被应用其中,被作为提高制造企业的运营效率、加速了高质量内容的生成的“利器”。杨星蕊提到,“在轻纺城元宇宙产品交易平台中,虚拟数字人的3D商品展示和实时渲染技术,为用户创造了全新的购物体验。”
事实上,生成式AI显著降低了制作成本和技术门槛,提高了其广泛应用的可能性。这项技术赋予虚拟数字人自我学习和进化的能力,大大增强了它们的交互性和情感表达,让虚拟数字人不仅可以实时与用户对话,理解并回应需求,提供个性化服务。还能模拟人类情感,与用户建立更深层次的情感连接,极大程度地提升了虚拟数字人的场景适应能力。
当技术创新和商业模式不断优化,虚拟数字人将在更多领域发挥重要作用,提升体验和服务效率。杨星蕊预计,随着技术成熟和应用场景的扩展,预计未来三到五年内,虚拟数字人将在更多行业和场景中广泛应用。
她举例称,在文化旅游领域,虚拟导游能提供沉浸式讲解和互动体验,并通过虚拟现实技术生动展示旅游目的地;在文化出海方面,虚拟数字人将推动中华文化全球传播,以虚拟演出和艺术展览让海外观众深入了解中华文化。
虚拟数字人还可在国际文化交流中担任文化大使,促进跨文化理解。技术创新和商业模式优化将使虚拟数字人在娱乐、文化旅游和国际交流等领域发挥重要作用,提升体验和服务效率。
演进——技术创新 场景深化
尽管新一代虚拟数字人已经走入普罗大众的视野,但热度持续提升的“B面”是日新月异的技术更迭、用户体验的更多诉求,都在向这一新兴赛道发起挑战。当市场开始逐渐回归理性,行业将更加关注数字人在场景中的表现,以及落地后的成效和商业价值。
事实上,尽管虚拟数字人技术在高精度渲染方面已经取得显著进步,但在大规模应用场景中仍需优化,以确保每个虚拟数字人的表现质量和流畅度。实时交互技术在处理复杂对话和多轮交互时,也仍需提高响应速度和准确性。同样的,融入生成式AI的虚拟数字人在落地成效上,也面临技术的稳定性、用户接受度,以及具体应用场景的适配等问题。
谈及技未来的优化方向,杨星蕊强调了四个关键层面。
第一,提升表现力和自然度:进一步改进虚拟数字人的面部表情和动作捕捉技术,使其表现更加逼真和自然,增强用户的沉浸感。
第二,加强情感计算和多模态交互能力:开发更先进的情感计算模型,使虚拟数字人能够识别和表达更复杂的情感状态;同时,增强虚拟数字人与用户在视觉、听觉和触觉等多模态上的交互能力。
第三,优化大规模应用场景中的性能和稳定性:提升系统的计算效率和稳定性,确保在大规模应用中依然能够提供高质量的服务,满足用户的需求。
第四,数据隐私和安全:持续关注和改进数据隐私和安全问题,确保用户数据的安全性和隐私保护,建立用户对虚拟数字人的信任。
对于海百川科技而言,下一步将继续深化虚拟数字人的技术研发,重点提升智能化和交互能力,加强开发更加逼真的面部表情和动作捕捉技术,增强虚拟数字人的情感表达和互动体验。同时,拓展更多的应用场景重点布局智慧城市和医疗健康等领域。在智慧城市方面,虚拟数字人将作为智能助手,提供城市信息、公共服务和紧急响应等功能;在医疗健康领域,虚拟数字人将辅助医疗诊断、健康管理和患者随访,提升医疗服务的效率和精准度。
杨星蕊进一步透露,海百川科技还会加强产学研合作,带动产业链发展。通过建立开放合作的平台,希望与更多的企业、研究机构和开发者携手,共同探索和开发新的应用场景和商业模式,推动虚拟数字人技术的普及和应用。
随着技术的加快演进,虚拟数字人技术应用场景的不断增多,企业需要面对如何挑选最适合自己的开发商这一问题。“技术实力、产品成熟度、客户案例、服务支持、数据安全,是企业在选择虚拟数字人技术提供商时,应该主要关注的维度。”杨星蕊说。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。