2024年4月20日
北京朝阳区中电发展大厦
元宇宙科技 虚拟现实

高炜:平行云赋能数字人的规模化应用

当下,我们已经通过数字员工完成了诸多业务,比如线下一体机、官方网站的客服以及相应的业务营销场景中的沟通服务,和手机终端的实时沟通和咨询等。
与这些基础服务的数字员工不同,AI交互的数字人往往具备三个特点,分别是拟人的面貌、AI语音语义能力,以及实时沟通和交流能力。然而,囿于轻量化终端设备、本地算力和成本等问题,AI数字人面临着规模化落地和应用面的困境。

数字人规模化落地的三大问题

平行云首席布道师高炜介绍:“一个数字人的制作包括建模,渲染和驱动三个流程。一般情况下,建模是以真人或原画设计为原型进行3D数字人建模,在驱动数字人的同时,我们还需要接通AI语音语义的理解和交互,最后再对数字人模型及其运动轨迹进行渲染。”

然而,三维渲染、语音合成和实时交互的背后,需要GPU算力支持。数字人规模化落地和应用意味着将对GPU算力增加依赖,这也就直接凸显了当下算力不足这一问题。
高炜表示:“首先,是算力问题,并不是任意一台普通的电脑都会有高配的显卡。其次,日常生活中,大家一般都是用轻量化平板或手机之类的终端设备与数字人交互,数字人在这些轻量化终端运行时,渲染和显示速度很难跟上,更无法满足数字人超写实的需求。最后,算力不足的问题,也导致我们没有办法很轻便地将数字人部署在各个业务场景中。”
实时云渲染刚好可以解决以上这些问题,通过实时云渲染,可以让数字人轻便地在各类智能终端上流畅地运行、使用和传播,助力数字人应用规模化落地,赋能数字人业务。
实时云渲染,解决数字人规模化落地的痛点
首先,关于算力不足的问题。实时云渲染技术可以理解为,将原本需要在本地渲染的算力转移到云端,依托云端的服务器来实现。而云端服务器的算力就趋近于无穷,可以较好解决算力不足这一痛点。
其次,关于轻量化的设备不足以运行实时高精度的数字人应用的问题。若采用实时云渲染方式,所有应用的渲染都将通过云端服务器来实现,用户手中的终端智能设备仅仅用于指令的上传和对音视频流的解码,大大地降低了对终端设备算力的依赖。
最后,将应用部署在各个实际场景中的成本是非常高的,因为不是每个人都具有高端显卡的设备,客户也不可能给每位用户配一台高端设备。利用实时云渲染,相当于在任意智能终端仅仅需要通过网络来接收相应部署在云端数字人应用的音视频,对于终端本身的位置的依赖就低了,因此可以轻便地、灵活地、低成本地访问云端资源。

所以,利用实时云渲染技术之后,我们就可以依托云端无限的算力,带来终端至简的体验,完美解决了数字人在广泛场景下规模化落地的需求。
高炜介绍:“平行云LarK XR实时云渲染技术,就是为企业级客户实现技术和产品云化转型服务的产品,目前已服务超过400家企业级用户,20多个行业场景。”
LarK XR实时云渲染技术解决方案
平行云LarK XR解决方案内部是四个产品,每款产品都围绕数字人规模化落地应用的痛点和问题提供解决路径。
首先,若多个用户对同一个数字人进行业务访问,这款产品首先要具有GPU算力池化功能,这一功能可以解决多个用户跟数字人交互时,云端服务器GPU算力如何分配,又如何匹配到每一个应用的问题。在LarK XR中,被称之为“雅典娜”。

其次,客户在终端交互,服务应用在云端。而云端传输到终端需要经过网络,网络传输需要有相应的码率自适应以及调整。这是因为每一个客户网络条件是不一样的,地点也是不一样的。这就是“赫尔墨斯”解决的问题,根据用户所在的位置和网络情况,动态自适应码率,从而达到更好地交互体验。
然后,在实际交互中,用户与数字人交互的终端也是不同的,比如有人用平板,有人用手机,有人用电脑,甚至未来可以使用VR眼镜等设备。因此,我们需要对各种各样的智能终端进行兼容,以便人们能够使用自己的个性化智能终端来与数字人进行交互,这部分问题是由阿波罗来完成的。
最后,我们有一款后台管理平台,上述所有功能以及应用管理,系统运维监控,二次开发等等,都是由盖亚PaaS管理平台来实现。
这就是平行云LarK XR的产品特点,高炜介绍:“平行云的定位主要是服务于开发者和行业生态伙伴,他们可以利用我们这些产品的特点来解决他们的实际问题,还可以根据具体的业务和场景,进行深层次二次开发,来拓展更多的业务场景。”
高炜最后说道:“我们认为,用户在未来可以通过任意智能终端随时随地介入网络进行交互,而实时云渲染技术是让数字人应用在各个场景中规模化落地的最佳途径。”

发表评论

您的电子邮箱地址不会被公开。