什么叫AI虚拟人(ai虚拟人是什么)

文|王玲
编辑|张著
生产|数字智能
1985年,卡尔顿电视台第四频道决定推出自己的音乐电视节目。然而,当时英国类似的节目正在兴起,新节目要想迅速走红并不容易。导演洛基莫顿(Rocky Morton)带领的团队想出了一个新办法:在主持人身上做文章。下一期节目播出时,电视屏幕上出现了身穿深色西装、平时戴着墨镜的“AI主持人”Max Headroom。后来,外界称Max Headroom为“第一个计算机生成的电视节目主持人”。然而,这个所谓的“AI主机”实际上是一个假的AI。当时的计算技术还不够先进,全动、语音同步的头部还不能用在电视剧里。所以除了角色宣传,Max Headroom的真实形象并不是电脑生成的,而是由真实演员扮演的,需要四个半小时的化妆拍摄。时隔近40年,比Max Headroom更高级的虚拟人开始大规模进入大众视野。这一次,他们是真正的虚拟人。他们可以现场带货,可以像人类客服一样跟人对话,也可以像明星一样在舞台上表演。随着越来越多的虚拟人开始出现,这个新行业也迎来了一轮爆发式的增长。越来越多的公司进入市场,对商业模式的探索也越来越清晰。在本文中,我们将重点讨论:虚拟人是一个什么样的行业?它的技术壁垒高吗?为什么要赚钱?
一、进化:虚拟人如何变得越来越像人类?Max Headroom诞生在虚拟人的胚胎阶段,与此同时,世界上第一个虚拟歌手林明美出现了。但在80年代,这些虚拟人的拟人化程度很低,主要依靠手绘制作,只实现了对人类外貌的模仿。2000年后,CG(计算机动画)、动作捕捉等技术不断创新,逐渐取代早期的手绘制作方式。比如2001年发布的《指环王》中国咕噜人,就是用CG和动作捕捉技术创作的。这期间出现了第一个现象级的虚拟数字人:初音未来,3D虚拟偶像。其实初音未来是一个歌曲合成软件。当时Crypton Future Media基于雅马哈的Vocaloid系列语音合成程序开发了音源库,并以此为基础制作销售了虚拟歌手角色的home系列。洛天依,2012年出道的mainland China女虚拟歌手,也是基于雅马哈Vocaloid3的语音合成引擎的虚拟偶像。但无论是“初音未来”还是“洛天依”,都离我们现在看到的虚拟人相差甚远,因为即使有了CG、动作捕捉等关键技术的加持,他们仍然无法实现一个最重要的功能:与人互动,也就是说,虚拟偶像并没有人格化。直到2016年以后,虚拟人才开始越来越像“人”。
这一年,谷歌AlphaGo击败围棋冠军李世石,成为第一个击败职业九段的计算机围棋,人工智能开始进入大众视野。语音识别、自然语音处理、语音合成、语音驱动的人脸动画等技术,以及深度学习算法的突破,为虚拟人的发展提供了技术支持。简单来说,在过去,创建一个虚拟人,动画师和建模师可能需要一个接一个地、一帧接一帧地绘制角色。原画建模后,可以通过实时渲染、实景运动捕捉等技术实现。时间成本和资金成本比较高,主要用在影视娱乐行业,比如数字体双。但是AI技术发展以后,需求方可以直接使用AI完成图像建模和后续的驱动渲染,或者初始的图像建模依靠人力,后续的驱动依靠AI。随着拟人化程度的不断提高,很大程度上简化了生产工艺,降低了生产成本。比如2021年初,虚幻引擎中的开发者Epic Games发布了可以生成高保真角色的工具——超人类创造者(Metahuman Creator)。基于预先制作的高质量人脸素材库,用户可以通过自动混合和手动调整的方式快速生成虚拟人。小团队也可以用这个工具快速生成自己的主角。在此期间,我们看到的虚拟人有常驻主机营的肖扬,会作诗作曲的清华大学虚拟学生华,以及带货新秀阿雅依。
二。行业:谁在做虚拟人?去年“元宇宙”概念火了,给虚拟人带火了。阿雅伊、艾玲、华、肖扬、刘等众多虚拟人物纷纷登场。然后,行业掀起投资热潮。开源证券在一份研究报告中指出,仅2021年下半年,就有近20家相关企业完成融资,其中包括IDG资本、红杉中国、顺为资本等明星投资机构。然而,虚拟人的流行并不仅仅是由“元宇宙”推动的。我们上面说过,AI、深度学习等技术的突破,大大降低了虚拟人的制作门槛,所以技术进步是虚拟人流行的根本推力。尤其是对于完全由AI驱动的虚拟人,最终效果受到语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)、语音驱动的面部动画(ADFA)等技术的影响。换句话说,只有具备了以上的技术要素,一个虚拟人才可以看到、理解、思考、回答和呈现。所以,想要切入这个行业的玩家需要具备以上一项或多项技术能力。目前的数字虚拟人产业链分为三层:
基础层:主要提供建模/渲染引擎等基础软硬件。虚拟人视觉制作的产业化过程包括建模、骨骼绑定、运动捕捉、表面捕捉、渲染、材质计算等环节,需要显示设备、光学设备、传感器等硬件产品,以及建模绑定、渲染引擎等软件产品。这一层做得好的大多是国外公司,比如大家熟知的《王者荣耀》 《原神》,就是基于美国Unity公司的渲染引擎打造的。平台:提供软硬件系统、生产技术服务平台、AI能力平台。大部分进入的中国企业都位于这一层。比如商汤、从云、易图和迪法恩斯,AI四小龙,比如在语音识别领域做得比较好的科大讯飞。还需要特别关注百度、腾讯、阿里等大头厂。基于自身在底层技术和硬件架构上的沉淀,在产业链的布局上会相对全面,往往会针对不同行业提供相应的数字化技术服务平台和解决方案。比如网易的伏羲,可以提供游戏行业解决方案、空间智能互动解决方案、文旅虚拟代言人解决方案等。比如阿里有一个AI虚拟模型塔,用在电商上。商家只需要上传一个产品的瓷砖,就可以生成模型的实拍图;例如,百度AI Cloud推出了智能数字人平台——西灵,致力于打造面向演艺的智能服务型数字人,还推出了基于终端实时渲染的虚拟影像智能交互解决方案。应用层:虚拟人应用的每个场景。比如相对成熟的影视、传媒、游戏领域,以及金融、文化旅游等。也是数字虚拟人实现商业化的重要途径。
三。价值:虚拟人的商业化是怎样的?随着虚拟人的不断出现,外界对这个行业的市场前景给出了较为乐观的预测。量子在《数字虚拟人深度产业报告》中预测,到2030年,中国数字虚拟人整体市场规模将达到2700亿元。乐观的背后,首先要明白的是,虚拟人能带来什么价值?这就决定了这个行业的天花板,以及产业链的相关参与者如何商业化。从应用层来看,目前主流的虚拟人可以分为两种:服务虚拟人和身份虚拟人。前者主要用于替代现实生活中的服务,是现实世界中服务型角色的虚拟代表;后者多为虚拟IP/偶像,意在推动虚拟内容的生产,也可以是虚拟世界中用户的第二个分身。
比如获得万科杰出新人奖的员工崔,浦发银行的数字员工小普,都是服务型的虚拟人。他们的出现是为了能够帮助地面上的企业。乐华娱乐的虚拟偶像团体“A-soul”,靠短视频走红的刘,和查理同台演出的,都是基于身份的虚拟人。在应用场景和商业模式上,这两类虚拟人有很大的不同。服务型的人更面向to-b市场,更重要的是如何通过AI赋能企业。经济效益不在于直接创造增量收入,而在于降低劳动力成本。网易福喜营销负责人唐曾公开表示,虚拟人的本质逻辑是降低成本,提高效率,让AI更好地服务人类。因为现实中有很多简单重复的工作,可以用虚拟人代替,而且AI出错的概率比真实员工小,不受空间和时间的限制。对于入驻企业,可以提供成熟的面向服务的虚拟人、一项或多项技术,以及针对不同行业的个性化定制解决方案和服务。这就考验了公司底层的AI实力。比如百度打造的第一个互动虚拟偶像杜潇潇,集合了百度在多模态交互、3D数字人体建模、机器翻译、语音识别、自然语言理解等多项技术的能力,甚至在高考语文作文中获得高分。她创作的画作还可以参加Xi美术学院的毕业展。身份虚拟人更多面向to C市场,目前主要集中在游戏和媒体领域。变现模式主要是打造虚拟偶像或者虚拟IP,先在C端扩大粉丝流量,再通过流量变现。比如小红书出现后一个月,AYAYI就陆续与娇兰、保时捷等国际大牌达成合作。2021年9月,Ayayi成为阿里巴巴首位数字员工,担任天猫超级品牌日数字经理;虚拟玲玲也成为了商业宠儿,与VOGUE、奈雪茶、特斯拉、乐城、KEEP等品牌开展了跨界合作。也就是说,基于身份的虚拟人商业模式的核心是粉丝经济,类似于现实生活中的明星。可以通过品牌推广、代言、参与节目、打赏直播、发行音乐专辑、周边销售等方式实现。其特点是能带来较高的收入增量。乐华娱乐的泛娱乐业务收入从2020年的2110万元增长至2021年的3790万元,主要得益于虚拟艺人团体A-SOUL的商业开发所产生的收入。安信证券估计,A魂贡献了约1700万元的增量收入。不过这类虚拟人的要求会比较高。如何打造一个一线虚拟偶像,并保证其能长期留在一线,并不容易。这考验的其实是品牌对IP和内容的长期运营能力。从更广阔的全球范围来看,在这个层面上,中国落后于欧美。毕竟有太多中国公司想做迪士尼,但最后都是渐行渐远。究其原因,相比国外成熟的IP运营体系,国内娱乐公司已经具备了IP建设的意识,但IP持续更新和运营能力欠缺。虚拟人行业是一个追赶甚至赶超的机会,但是已经在或者即将进入这个行业的公司需要思考的是,他们想要的是短期利益还是长期的数字资产。面对新一轮的IP孵化和商业化机会,这大概会决定他们在这个行业能走多远。

综合资源

疯狂杀戮! 1分钟完成100页PPT,天工AI人工智能快速方法!

2024-11-8 23:40:00

非常治愈的动画电影(日本治愈动画电影推荐)

2022-8-15 13:30:01

购物车
优惠劵
搜索