2024年4月26日
北京朝阳区中电发展大厦
元宇宙科技 虚拟现实

虚拟数字人名单越排越长,智能语音上演“创富”传奇

近年来,人工智能相关技术持续演进,与云计算、大数据、物联网、5G等技术不断融合,成为引领未来的新兴战略性技术,是驱动新一轮科技革命和产业变革的重要力量。

在新科技革命和产业变革的大背景下,人工智能产业化和商业化进程不断提速,正在加快与千行百业深度融合,正在促进新兴产业之间、新兴产业与传统产业之间以及技术与社会的跨界融合发展。

中国软件网、海比研究院认为,人工智能与产业深度融合,将成为企业释放数字化叠加倍增效应、加快战略新兴产业发展、构筑综合竞争优势的必然选择,全面梳理人工智能技术、应用的发展态势,对推动人工智能持续健康发展至关重要。

为此,中国软件网、海比研究院特别推出了“人工智能行业洞察”系列报道,通过对人工智能技术、应用、企业等深度报道,助力企业数字化、智能化。

在阿尔伯特·爱因斯坦(AlbertEinstein)获得诺贝尔物理学奖100周年之际,作为现代历史上最聪明的头脑和最知名的人物之一,“数字爱因斯坦”重返“人间”。
国外一家公司推出了“数字爱因斯坦”,是同名人物的现实再现,借助对话式AI的力量,普通人可以与他实时互动,参加他的日常测验,或询问有关他生活和工作的任何事情。
“客自长安来,还归长安去,就在这地方,梦开始穿越……”国内首位秦腔领域虚拟人——第九届中国秦腔艺术节虚拟推荐官秦筱雅亮相,蕴含着秦腔承古开新的精神密码,可以说就是人格化的秦腔艺术,是秦腔艺术的数字化代言人。
除此之外,像清华虚拟女学霸华智冰,抖音美妆达人柳夜熙,以及抖音名人“Axi”、虚拟女团“A-SOUL”,江苏卫视2022跨年演唱会的虚拟人“邓丽君”,湖南卫视全新综艺《你好,星期六》启用的数字主持人“小漾”,等等,越来越多的虚拟数字人席卷而来。
“元宇宙”热度持续抬升,而“虚拟数字人”却乘机进入了大众视野。不过,现在市场上越来越多的虚拟数字人不是医学上使用的有生命体征的人,也不是半机械人和超人类。当然这些虚拟数字人已经在除了元宇宙以外的领域开始大行其道。
哈佛商业评论认为,虚拟数字人通过情感联系的客户对品牌的忠诚度提高了4倍,品牌销售额会提高2倍。
海比研究院认为,虚拟数字人类在行动。目前,数字人类正在被部署为品牌大使、数字员工、客户支持代表、医疗保健顾问、虚拟主播等,从独特的外观到个性化的语言,都会对用户产生最积极、最持久的影响,商业收益开始增长。
虚拟人处于爆发点,行业迎来机遇期
伴随着元宇宙的兴起,虚拟数字人正越来越频繁地出现在公共视野,而且借机野蛮生产,大有遍地开花之势。
从英伟达发布会上虚拟CEO黄仁勋,到美的旗下品牌华凌分别担任美的数智体验主理人和潮流设计主理人虚拟偶像凌魂少女·凉然、凌魂少女·暖沁•••
在抖音平台,一个名叫“Axi”的小女孩没有台词,没有与用户互动,反而赢得了50多万抖音粉丝。能够互动的女性团体“A-SOUL”获得了更多的人气。
在新华社APP上,一个AI复合主播以零错误播出了1万多条新闻,可以实现对日常和突发事件的实时响应,并且看起来越来越像真人了。
腾讯同步推出了一些基于特定场景的虚拟数字人,如平安普惠数字员工、新华社主播“新小微”、航天员“小诤”、3D手语翻译官“聆语”、故宫博物馆导游“福大人”等。
阿里巴巴的虚拟数字人也是为自身业务需求服务。借着北京冬奥会的契机大火了一把的数字人“冬冬”,仍是以直播带货为主,契合其老本行——电商业务的需求。
光大银行虚拟人小智  
目前,虚拟数字人出现在各种服务场合,数字员工、虚拟偶像、虚拟代言人、虚拟主播……虚拟数字人在社交、媒体传播、营销、传统产业等领域的价值正在逐渐显现。
如果将元宇宙比作一艘驶向未来的宇宙飞船,那么虚拟人就是未来的门票。对于用户来说,虚拟人是任何进入虚拟世界的人的化身。
可能你听说过虚拟人、数字人和虚拟数字人,甚至数字替身等概念,不过现在统统被人们成为虚拟数字人,与医疗上的虚拟人等截然不同。
中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟的报告认为,与医疗领域的数字化人体不同,虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在。
因此,报告认为,虚拟数字人具备三方面特征:
一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;
二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;
三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。
更直接一点,虚拟数字人都是计算机图形学技术(CG)创造出的与人类形象接近的数字化形象,并赋予其特定的人物身份设定。
从这个概念可以发现,要实现虚拟数字人和别人顺畅交流,对背后企业的技术要求极高,特别是AI技术。
虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等5个模块构成。
人物形象可分为2D和3D两大类,又可分为卡通、拟人、写实、超写实等不同的风格;语音生成模块和动画生成模块,可分别基于文本生成对应的人物语音,以及与之相匹配的人物动画;音视频合成显示模块将语音和动画合成视频,再显示给用户;交互模块使数字人具备交互功能,即通过语音语义识别等智能技术识别用户的意图,并根据用户当前意图决定数字人后续的语音和动作,驱动人物开启下一轮交互。
虚拟人优势逐渐显现,逐步渗透各细分赛道。
在金融、医疗等APP的客服界面中,虚拟数字人与真人等需要解答问题的用户互动,7×24小时持续提供服务······
在企业内部的虚拟数字人,则多是为企业端业务场景量身定制,或者是与旗下智能车载、智能家居、智能交通等智能设备结合,定位是服务型数字助手。
“虚拟人”的普及,可使目前依赖于高IP价值现实人物(如明星)的商业模式中的成本大幅降低,内容产出效率大幅提升。
同时,“虚拟人”也大幅提升了虚拟角色与用户的交互真实性。技术走向成熟或已经为虚拟人的应用提供了前提条件,而虚拟人自身亦有显著优势,使得其应用场景逐步拓宽。
虚拟人并非真人,天然拥有工作不出错、全天候在线、无负面新闻、可低成本运营等优势。
虚拟人有更强的用户交互性,UGC属性为其内容用户生产提供可能。
凭借降本增效优势,虚拟人或将颠覆行业运营模式。
技术突破成为核心驱动力,虚拟人行业焕发生机
技术加速实现升级迭代,显著的提升了虚拟人赛道的热度。
虚拟人的发展早期受到技术的制约,后期随着计算机动画(CG)和人工智能(AI)等技术的发展,制作过程得到简化,虚拟人迎来爆发性增长。
受访的国内头部人工智能独角兽企业——云知声的一位专家认为,技术突破为虚拟人行业发展提供核心驱动力。
计算机图形学技术CG和AI是虚拟数字人的核心技术,目前都取得比较大的突破。
以AI为例,基于计算机视觉(CV)、自动语音识别技术(ASR)、自然语言理解(NLU)、语音合成技术(TTS)的多模态的人机交互、高逼真的声音和图像的合成,都让虚拟数字人不再是简单的卡通形象,而是可以感知用户输入,比如通过人脸感知用户靠近,通过语音识别、手势识别等感知用户输入;处理特定领域的任务,如数字人RPA,对于大规模数据进行处理的数字员工;以及以用户喜欢的方式输出相应的结果,如采用用户定制的声音输出,甚至可以有“捏脸”方式塑造用户喜爱的形象。
虚拟人相关技术公司也受资本热捧,虚拟人赛道热度提升显著。进入2021 年下半年以来,虚拟人相关公司融资进程加快,互联网大厂纷纷入局,为行业带来资本和技术支持,行业景气度持续上升。
创建数字人类身份的过程由3个关键要素组成:模型创建、动作捕捉和实时图形。
演员必须佩戴特殊的标记,才能创建其面部的3D模型。他们的面部和身体运动需要由多个摄像机不断拍摄,这些摄像机将这些动作的每个帧和角度传输到负责渲染数字角色的系统。
第一步模型创建。从技术上讲,有两种方法可以创建全新的虚拟身份。如果你想使用动画卡通人物,你应该从头开始绘制你的新角色。但是,当涉及到数字人类身份时,您需要从动作捕捉设置开始。
通常它必须是一个高度受控的舞台,具有多个高分辨率摄像机和受控照明。有可用的软件可以帮助您仅使用移动设备或笔记本电脑即可获得类似的结果。当然,使用网络摄像头或手机制作的模型无法与在专业工作室中创建的模型相提并论。
当人类面部和身体的数字模型被编译后,是时候启动动画了。
第二步,动作捕捉。对于虚拟化身,模特将由演员的面部动作实时“驱动”。由于3D头像不依赖于任何特定的人,因此任何演员都可以为数字角色模型的工作奠定基础。
无论演员是谁,角色将永远保持自我。要捕捉演员的动作,你需要一件带有运动传感器的特殊套装。
第三步,实时渲染。最后一个要素是实时图形处理。由于数字素材和逼真的图形必须实时动画化,因此您将需要一台功能强大的计算机和一个特殊的软件引擎,将演员的动作与头像的3D模型相结合。
通常可以使用游戏开发人员用于视频游戏的引擎来完成。唯一的区别是在视频游戏中,所有角色动作都是预先编写的,但是对于数字人类,镜头必须实时渲染。
目前,市场上的建模工具逐渐增多。
2021年,EpicGames、英伟达分别推出了自己的虚拟人制作工具MetaHuman Creator 和OmniverseAvatar,在保证人像质量的同时提高了虚拟人的制作效率。
Epic的建模工具MetaHumanCreator是一款基于云的应用,可以帮助开发者快速地构建出高保真的虚拟人物形象,极大地加速建模效率,并同时降低了建模成本。
MetaHuman还允许开发者便捷地导出、下载虚拟人文件,以进行后续的开发。使用MetaHuman塑造的人物更加写实,开发门槛较低,几乎所有人都可以快速上手。
相比于之前制作虚拟人像所需要的高成本,MetaHuman工具目前对开发者免费开放。
英伟达的实时仿真模拟和协作平台Omniverse被称为“工程师的元宇宙”,包括宝马、爱立信、沃尔沃和Adobe等众多公司都有采用Omniverse。
OmniverseAvatar旨在帮助开发者通过英伟达的Omniverse平台创建可以理解真人自然说话意图的交互式虚拟角色。OminiverseReplicator则是一种用于训练深度神经网络的合成数据生成引擎,从而提供创建训练AI所需的大量数据。
OmniverseAvatar整合了英伟达在语音AI、计算机视觉、自然语言理解、推荐引擎和模拟方面的技术。利用所述平台创建的虚拟形象是具有光线追踪3D图像效果的交互式角色,并能够看见、说话、谈论各种主题,以及合理地理解表达意图。
值得一提的是,Omniverse同时新增了英伟达早前发布的一系列AR/VR功能。
智能语音技术赋能,虚拟人拥有更强交互能力
伴随 AI 技术的加速突破和数据积累,虚拟数字人是继语音助手之后智能语音技术新的应用领域
虚拟人语音交互的核心在于AI,包括语音识别、语义理解、自然语言处理、语音交互等,强大的AI交互能力是智能语音产品的核心竞争力;而大量数据的积累能有效提升模型表现高度,提升虚拟人的交互体验。
接受记者采访的云知声专家认为,智能语音技术主要是用于虚拟人的交互。智能语音技术主要包括:
第一,前端降噪和定向,主要确保在噪声环境下也可以取得比较好的识别效果,或者指向特定方向收音,从而确保交互的效果。
第二,唤醒,利用这一技术,用户可以为虚拟数字人自定义自己倾向的名字,增加唤醒数字人时的亲切感和趣味性。
第三,声纹技术,可以让数字人倾听特定人员的声音,或者区分不同人员的年龄和性别的生物特征,从而更加有专属感。
第四,语音识别+自然语言理解技术,主要将用户的声音转换成文字,并对文字进行处理,从而理解用户的意图,做出正确的应答。
第五,语音合成。用户可以给出部分样音,从而让虚拟人给出的反馈声音是自己的朋友、恋人、亲人等,更加舒适。
面对虚拟数字人的新行业机遇,互联网公司、AI企业和硬件厂商均入局智能语音赛道。
腾讯、百度、阿里、字节等互联网巨头纷纷布局AI技术,入局智能语音领域,并在虚拟人赛道中拥有“To C”的传统优势。
凭借在人工智能领域深厚的技术积淀,云知声、科大讯飞等AI企业在虚拟人领域亦有极强的市场竞争力。
而华为、小米手机等硬件厂商早期在智能语音助手、智能音箱等家居生活场景产品的布局,使得硬件厂商有资本抢滩虚拟人赛道,完善其智能家居场景的搭建。
目前我国AI智能语音行业进入到了技术落地期。国内外的相关企业都纷纷开放语音生态系统,以产业内合作的方式,将语音技术植入产品和或应用于相关业务场景,构建全产业生态链厂。
不管人工智能的发展进程如何,国内外的各个厂家均开始从不同维度布局相关的产业链。如谷歌打造开发者生态链,推出Google Home,试图建立物联网时代安卓系统。而苹果基于智能硬件定标准,定制平台、积累数据,重视物联网时代生态控制权。
国内的科技巨头如百度则是通过开放语音生态系统,以产业合作的方式,将语音技术植入产品和或应用于相关业务场景,构建全产业生态链厂。
虚拟数字人开疆拓土,商业化拉开帷幕
虚拟数字人逐渐实现在多场景、多领域的融合、应用、落地。
尽管目前数字人的发展环境、整体情况还处于起步阶段,但随着虚拟数字人技术的精进、市场价值的释放,将更全面、更深入地融入影视、金融、文旅等各个领域,充分发挥应用价值,迸发巨大的潜力。
从难易程度上看,新闻播报是虚拟人最容易实现应用的业务形式。相对于新闻播报,节目主持需要较强的专业能力和互动效果,且对运营能力要求更高。
同样简单易行的是直播带货。相对于真人主播,虚拟人主播具备一系列优势,有望为直播带货等带来新的活力。外表靓丽、风格突出的虚拟人博主AYAYI已经在小红书上开始带货。
依靠背后专业的团队运作,虚拟人偶像开始活跃在各大平台,并开始取得良好的“明星”效应。
广告营销在业务形态上天然和虚拟人有良好的结合,虚拟人的应用有望提升广告营销业务的增长潜力,整体板块估值有望提升,重点关注处于估值低位且有相关业务布局的公司。
在金融领域,UneeQ为瑞银设计开发了很多创新解决方案,不仅可以让专家可以同时在多个地方,而且可以使其看起来很容易。
瑞银首席经济学家丹尼尔·卡尔特的数字人类替身可以与客户会面,以提供独一无二的数字体验。也能够利用瑞银的财务预测数据,并“面对面”向高财富客户提供见解。他也可以全天候进行个性化的对话,这是真正的丹尼尔根本做不到。
在影视和传媒,云知声主要提供特定人员的声音复刻服务,针对一些故去的知名人士、用户指定的声优,通过他们的影像留声,提取样音,训练语音合成引擎,从而实现声音复刻。
在金融、文旅方面,云知声主要是提供完整虚拟数字人解决方案,完成具备企业或者城市形象的虚拟数字人的整体输出,并提供虚拟数字人背后一整套的多模态交互技术。
IBM最近发布的WatsonAssistant,是IBMCloud上的一项服务,可以帮助任何人构建和部署虚拟助手。IBM的人工智能技术允许用户对虚拟助手进行编程,远远超出一般的聊天机器人。
像起亚这样的公司已经开始在汽车商店中使用IBM的技术和数字人类。ANZ、Sony、P&G、苏格兰皇家银行和梅赛德奔驰等品牌已经将AI数字人类作为其客户服务的一部分。
市场普遍认为,虚拟数字人行业正处在爆发期,虚拟人正受到越来越多人的欢迎。
受益于技术进步带来的应用场景开拓和虚拟人的多维度优势,虚拟人行业开始步入成长阶段,目前市场仍处于前期培育阶段。根据量子位报告的测算,中国虚拟人行业有望在2030年超过2700亿元的整体市场规模。
根据Statista2022年1月进行的一项关于虚拟人类普及的调查,大约68.5%的中国互联网用户认为,虚拟人的外表或声音是吸引他们注意虚拟角色的关键,被创意作品所吸引的用户也达到了47.8%。广告在提高虚拟人的受欢迎程度方面也发挥了作用,占比大约16.5%。
中国互联网用户对虚拟人类感兴趣的原因 资料来源:Statista
接受记者采访的云知声的专家认为,从技术和需求两个方面都让虚拟数字人行业处于成长期。
一方面,随着终端和云端计算能力的快速增长,以及AI技术自身的不断完善,在之前无法实现流畅和逼真效果的虚拟数字人变得可行了。
另一方面,用户也希望有更多具象化的虚拟形象,从而让体验得到提升。
虚拟数字人是元宇宙一个比较重要的分支方向,甚至有可能成为主要的方向之一。
目前虚拟数字人面临的主要挑战是单个数字人定制成本比较高,周期也比较长,快速大规模应用还有一定的成本门槛。
未来,随着CG和AI技术发展,特别是智能语音技术的发展,大规模降低成本,提升效率,从而让虚拟数字人快速走向ToB和ToC的市场。
文章来源:中智观察,如有侵权,请联系删除。

专家观点分享

(点击文字即可跳转阅读)

西门子-石银明博士 | 云问科技-田有为

易知微科技-阚海明 | 悉见科技-刘怀洋  

智汇云舟科技-陈虹旭 | 商汤科技-杨燕

天行智能-安武 |UINO优锘科技-纪德勇

51WORLD-张焜棋|奥丁科技-Grissom

聚力维度-赵天奇|天娱数科-贺晗

平行云-高炜


发表评论

您的电子邮箱地址不会被公开。