网络营销

首页 » 常识 » 预防 » 虚拟数字人专题研究长短期展望,IP与赋能
TUhjnbcbe - 2024/8/25 18:30:00

(报告出品方/作者:安信证券,焦娟、冯静静)

1.虚拟数字人的三种建模成本、技术路径的差异

在虚拟数字人的整个产业链中,上游虚拟数字人的生成主要分为建模、驱动、渲染三大环节,其中虚拟数字人的建模生成是非常核心的一个步骤,也是较为困难的一环,奠定了未来使用的基础。目前虚拟数字人的建模生成主要有三种,按照人工参与程度的高低,依次为纯人工建模、借助采集设备进行建模、以人工智能进行建模;同时涉及到相关的软硬件,包括建模软件、驱动软件、渲染引擎、拍摄采集设备、光学器件、显示设备等。因此,虚拟数字人的上游投入集中在专业人才与相关的软硬件件成本。

1.1.纯人工建模方式——成本高、产能低

纯人工建模方式早就存在,虚拟数字人这一概念也不是这两年才有,而是可以追溯到20世纪80年代,人们开始尝试将虚拟人物引入到现实商业世界中,此时的虚拟数字人的制作以手工绘制为主。到21世纪初,CG、动作捕捉等计算机技术进步,建模师借助相关工具软件进行制作虚拟人,大部分的成本仍然是人工成本。

纯人工建模的具体步骤为:1)运用电脑软件画设计稿,描绘建构出人物的三视图;2)根据设计图纸确定人物三维的图形,运用MAYA、3DMax、Zbrush等三维建模软件建立基本的三维模型;3)除了建模师,虚拟人的运营需要团队的协作,虚拟人制作的其他环节还涉及到贴图师、绑定师、动画师、道具师、三维场景设计师等。

目前纯人工建模方式仍在广泛使用,市场上一些超写实的虚拟人或者明星的虚拟人,均可以基于这种建模方式做出来,但人工制作周期较长,且成本非常高,源于该种建模方式的成本主要跟人力相关,一是取决于制作团队的配臵大小,二是取决于建模的精度要求,虚拟人越逼真、越精细,所需的建模时间与成本就会越高。虚拟数字人相关制作人员的平均薪资水平在年涨幅明显,随着元宇宙热度的升温而一路走高,目前建模师、绑定师、动画师、道具师、三维场景设计师的月平均薪资水平分别为10-15k、10-30k、10-20k、8-15k、15-30k。

以虚拟数字人“邓丽君”为例,数字王国从年开始打造1.0版本的虚拟邓丽君,当时的技术难点主要在于没有足够的资料来参考,复刻已故明星的虚拟形象,基本上意味着从零开始打造。虚拟邓丽君基本上是通过人工建模方式做出来的,在当时技术条件还不成熟的情况下,制作团队参照了大量的邓丽君的过往照片、音频、视频,耗费了约一年半时间打造出虚拟邓丽君的面容、姿态与神韵。再比如影视特效公司运用CG等技术还原已去世的保罗在《速度与激情7》中的演绎,相关建模、渲染成本增加了约万美元。

目前超写实虚拟人的制作技术已有了突飞猛进的发展,制作一个类似虚拟邓丽君同样水准的虚拟人只需要几个月,但成本依旧较为高昂,产能低。虚拟邓丽君这种属于影视级别的建模,可以将其定义为影视级、超写实、高精度,应用场景有限,主要服务于特别的领域,比如舞台级别领域,且影视级别的虚拟人无法在普通的电脑端直接进行驱动,需要动用众多相关电脑,甚至其渲染都需要一个网络来进行,比如现在有些地方建有渲染农场,在服务器空闲的时候进行渲染。

影视级别虚拟数字人的前期建模成本为几百万到千万元,且不包括后续的驱动、渲染等。制作周期取决于团队规模的大小,一般来说,预计一个20人的团队需要耗费约半年的时间。所以,从团队配臵与制作周期来看,影视级虚拟人制作成本高的原因在于建模师、动画师等相关人员的工资待遇比较高。

1.2.借助采集设备进行建模——成本适中、应用广泛

现今虚拟数字人的制作时间与成本已大幅降低,但影视级的虚拟数字人对于众多品牌方来说仍然太贵,目前市场上大多数的虚拟数字人是成本相对低的卡通画风形象,各类游戏中的游戏角色其实是早期的虚拟人,可以被称为次时代游戏级别。不同于影视级别,次时代游戏级别的虚拟人的渲染在电脑端/手机端就可以完成,为考虑到用户的硬件运算能力,次时代游戏级别的虚拟人仍与超写实虚拟人在细节上有一定差距,即牺牲了一定的精细度,保证了画面的实时渲染。

除了前述的通过传统纯人工方式建模之外,目前次世代游戏级别虚拟人的建模大多是借助于外部扫描设备采集模型数据,数据的输入方式大致分为两种:

相机阵列扫描:使用上百台相机进行度的环绕拍摄,构建三维模型,基于模型进行数据的处理,然后转化成可以编辑的格式,再去进行相关的贴图、绑定、动画等操作。相机矩阵输入方式的优点在于制作周期短、节省人力,可满足大多数虚拟人的建模需求,是当前虚拟人建模的主流方式;但缺点在于不能从底层模型去大幅度修改参数;

结构光扫描:利用三维扫描仪对人体、外部环境等进行扫描,建立点云数据(pointclouddata),扫描精度越高,得到的点云数据越多,制作出的模型就越精细。相较前一种的相机矩阵扫描,结构光扫描是一种比较经济的扫描方案;但缺点在于扫描时间长,难以满足运动类目标的重建需求。

与从零打造一个虚拟数字人相比,在有外部采集设备助力的情况下,虚拟数字人的建模成本就会低很多。该种建模方式的成本主要为设备与人员成本,在几十万至一两百万元不等,可以应用于游戏、电影(不需要超写实、高精度)等领域。若模型的精细程度越高,则需要渲染的单元越多,成本就越高。

1.3.利用人工智能进行建模——成本低、技术有待提高

第三种是通过人工智能的方式来建模,依据的是算法与机器学习。机器能够自动生成虚拟数字人的前提是要获取足够多的数据,对大量的照片/视频进行分析,提取到人的各种数据与信息,然后去模拟出没有提取到的那部分数据,比如鼻子的高度,这不仅依靠算法公式,背后还要基于机器学习,建立在机器对大量人脸照片/视频学习的基础之上,样本越多,算法生成出来的模型就越精准。

人工智能建模的优势在于能够大幅降低成本。依靠前述两种建模方式,做一个次世代游戏级别的虚拟人至少需要几十万元以上的成本,还不包括后续的渲染、驱动等成本。但是通过人工智能技术进行建模,人力成本与时间成本都将降到最低。以前团队需要耗费数个月的时间进行建模,而人工智能可以在很短的时间内快速生成虚拟数字人,建模的过程无需人工,后期修缮环节需要人工参与,进而将建模成本控制在极低的范围。

人工智能建模的难点在于关键技术的突破。人工智能生成与驱动的虚拟数字人所呈现的效果受到语音识别、自然语言处理、语音合成、语音驱动面部动画等技术的共同影响。目前人工智能建模还远不能完全取代纯人工建模与借助采集设备进行建模的结果,尤其是超写实、影视级别的虚拟数字人,人工智能技术还不能完美的生成与驱动,算法过于复杂。即使突破了静态下高仿真的瓶颈,如何让数字虚拟人自然地交互,也是一大难题。人类可以从表情、肢体中读取丰富的非语言信息,因此数字虚拟人的表情、动作中一些细微的不自然都能被人们所察觉到。人工智能建模结果就像Siri等虚拟助理对话一样,存在一些差距,但仍在不断改进之中。

综上所述,目前市场上主流的虚拟数字人建模方式包括纯人工、借助采集设备与人工智能这三种,不同方式所适用的场景与所需的技术存在非常大的差异。由于人工智能建模方式依赖于长时间的机器学习以及技术的成熟度,因此当前制作虚拟人的方式仍然较为传统,国内虚拟人公司大多采用前两种建模方式,建模人员可以很好地把握虚拟数字人的精细度,尤其是超写实虚拟人的建模要求不仅是外形相似,动作行为神态等后续驱动也是非常重要的环节,需要人员在后期进行大量调试工作。此外声音也构成智能化虚拟人的重要一部分,如何让机器合成的声音更加自然、有情感,依旧是语音合成技术的较大难点,早期虚拟人如初音未来、洛天依等的声音,背后则是由真人经过训练配音的。

以人工智能为代表的技术将决定未来虚拟数字人的高度。以上三种建模方式的参与公司可以大致分为两类,一类为传统CG或图形学公司,核心技术为其“美术”能力,通常更专注于后期技术;另一类以人工智能技术公司为代表,凭借技术进入虚拟数字人领域,大多专注于自动化生成。目前虚拟数字人的制作公司仍以第一类公司为主,发展至今虚拟数字人的制作成本高昂,尤其是3D虚拟数字人的制作成本高达百万元,局限于B端应用,这一定程度上制约了行业的大规模应用与发展。未来虚拟数字人的发展方向在于其能够应用于广阔的C端领域,比如每个人均能拥有自己的虚拟人。因此,未来想要实现批量化生产虚拟数字人,重要前提是大幅降低制作门槛与成本,而人工智能技术是推动虚拟数字人规模化应用的重要基础。

2.虚拟数字人的商业化:B端先行,C端社交打开广阔空间

2.1.国内外虚拟人商业化存在差异

欧美日韩的虚拟数字人产业发展得相对较快,着力打造身份型虚拟数字人,一是重点打造虚拟IP,擅长做虚拟人的IP化运营;二是针对C端社交领域开发数字化身Avatar,一些用于生成虚拟数字人的工具化平台已经出现,可以快速生成自己的虚拟形象。虚拟数字人在C端市场的商业价值在于其具备强大的规模化能力,未来元宇宙中虚拟化身/分身的需求有待释放。而现阶段国内主要是在具体的服务端发力——服务型虚拟数字人,比如虚拟客服、虚拟导购、虚拟讲解员等,在实际能够变现的场景运用的比较多,在打造虚拟IP方面的探索相对不足。

身份型虚拟数字人与服务型虚拟数字人有着不同的商业模式,各有优势。

从变现能力的角度看,身份型虚拟人的变现能力更强。身份型虚拟人的商业模式类似于真人明星,通过品牌推广或代言、参演节目、直播打赏、发布音乐专辑、售卖周边等方式,依托粉丝经济进行变现,其特点是能带来较高的收入增量,如LilMiquela、初音未来;而诸如客服、直播带货等应用场景下的服务型虚拟人,其主要经济效益不在于直接创造增量收入,而是在于降低人力成本。虽然服务型虚拟人创造的经济效益较小,但服务型虚拟人的内核是人工智能,是元宇宙的基础构成要素,长期来看有非常可观的B端市场空间。

从数字资产的角度看,国外是真正的将虚拟人当作数字资产在进行运营,但是国内很多的服务型虚拟人的应用,不是将虚拟人当作一项数字资产,而是当作一项成本进行投入,更多是对现有行业的赋能,在短期内实现降低成本与提高运作效率。

总结来看,身份型虚拟数字人与服务型虚拟人的底层商业逻辑存在非常大的差异,甚至底层技术路径也不同。海外企业对虚拟人的技术路径的实现、应用场景的要求更高,对收入看得更长期;而国内虚拟人的发展更着眼于当下的运营效率的提高,商业化场景较为单薄,变现方式大多局限于直播电商等短期流量红利中,或者智能导购、客服等行业,进一步拓展价值空间很难,导致这个赛道的天花板偏低。

导致国内外虚拟数字人市场存在差异的原因,我们预计是技术发展阶段、用户规模等方面的不同。

1)运营层面,欧美具备较强的IP运营能力。一个成功的虚拟数字人的塑造,不仅是其形象具备真实感,最重要的是其人格具备真实感,而虚拟数字人的人格化塑造的过程就是IP化的过程。与国外成熟的IP运营体系相比,国内文娱公司虽然已经有了IP构建意识,但是IP持续更新与运营能力不足。纵观美国娱乐影视行业的发展历程,IP始终是好莱坞的核心,并通过IP延伸出强大的多元化产业链条,比如迪士尼。

2)技术层面,欧美公司虚拟数字人制作水平高且分工明确。好莱坞IP运营的历史与好莱坞电影工业发展是一脉相承的,即工业的发展水平与盈利状况影响着IP运营的水平与效果,虚拟数字人行业的发展亦是如此。一方面,欧美基于生产技术优势,已经有一些用于快速生成虚拟数字人的工具化平台出现(如OmniverseAvatar、MetaHumanCreator),且有较多面向C端的产品。另一方面,欧美虚拟数字人行业的上中下游分界明显,一体化程度低,专精某一技术发展,对非核心技术采取外包合作;而国内有较多公司采用产业链一体化的形式进行虚拟数字人制作。

3)用户层面,国内的优势在于庞大的用户规模,存在各细分领域的需求。基于人口基数优势,国内产业在众多细分方向上均较容易形成规模效应,虽然国内外存在一定的技术落差,但虚拟数字人在国内有多元化可探索的空间。因此,国内企业更注重于服务型虚拟数字人的开发,以定制为主,根据用户需求进行特定设计,这一选择有助于规避不同行业的技术差异。

2.2.国内外虚拟数字人应用案例

基于影视特效行业的多年沉淀,虚拟数字人在制作端已经形成了一套较为完备的工业化制作流程,即虚拟数字人的制作生产已不是难题,问题在于运营端,对虚拟人的运营更多是如何变现。不同类型、不同应用场景的虚拟数字人,其作用与所产生的价值不同,背后的技术路径也不同。现阶段已实现商业化的虚拟数字人主要以虚拟偶像、虚拟主播、虚拟客服等为主,涵盖文娱产业、直播带货、品牌营销及其他B端应用场景:

虚拟偶像AYAYI、LilMiquela、Imma等以图片形式为主,制作主要通过建模及美工;

虚拟美妆达人柳夜熙则从静态图片升级为动态视频,其运营逻辑类似于网红、KOL领袖,单个发布作品的制作周期相比图片更长,技术以传统动画影视制作方式为主;

金融、文旅、销售等行业的虚拟客服则开始有了人工智能的加持。

因此对于虚拟数字人公司来说,在制作虚拟数字人之前,需要思考虚拟数字人的“人设”定位及运营逻辑。不同的运营逻辑将带来不同的效用价值,要大致规划好未来的变现路径。就像明星有“人设”一样,虚拟数字人也有“人设”,进而对应不同领域的应用。做一个虚拟数字人的门槛有限,制作出来的虚拟形象如何被更多人喜欢与接受,如何打造人设、做什么,才更重要。(报告来源:未来智库)

2.2.1.虚拟偶像:IP运营为核心,商业价值弹性大

从虚拟数字人的发展现状来看,相对于服务型虚拟人,变现能力更强的是身份型虚拟人,尤其是美国,在应用方面重点打造虚拟IP,日韩也主要落地在文娱领域,擅长打造二次元与娱乐偶像。国内虚拟人市场

1
查看完整版本: 虚拟数字人专题研究长短期展望,IP与赋能