什么叫AI虚拟人(ai虚拟人是什么)

文|王玲
编辑|张著
生产|数字智能
1985年，卡尔顿电视台第四频道决定推出自己的音乐电视节目。然而，当时英国类似的节目正在兴起，新节目要想迅速走红并不容易。导演洛基莫顿(Rocky Morton)带领的团队想出了一个新办法：在主持人身上做文章。下一期节目播出时，电视屏幕上出现了身穿深色西装、平时戴着墨镜的“AI主持人”Max Headroom。后来，外界称Max Headroom为“第一个计算机生成的电视节目主持人”。然而，这个所谓的“AI主机”实际上是一个假的AI。当时的计算技术还不够先进，全动、语音同步的头部还不能用在电视剧里。所以除了角色宣传，Max Headroom的真实形象并不是电脑生成的，而是由真实演员扮演的，需要四个半小时的化妆拍摄。时隔近40年，比Max Headroom更高级的虚拟人开始大规模进入大众视野。这一次，他们是真正的虚拟人。他们可以现场带货，可以像人类客服一样跟人对话，也可以像明星一样在舞台上表演。随着越来越多的虚拟人开始出现，这个新行业也迎来了一轮爆发式的增长。越来越多的公司进入市场，对商业模式的探索也越来越清晰。在本文中，我们将重点讨论：虚拟人是一个什么样的行业？它的技术壁垒高吗？为什么要赚钱？
一、进化：虚拟人如何变得越来越像人类？Max Headroom诞生在虚拟人的胚胎阶段，与此同时，世界上第一个虚拟歌手林明美出现了。但在80年代，这些虚拟人的拟人化程度很低，主要依靠手绘制作，只实现了对人类外貌的模仿。2000年后，CG(计算机动画)、动作捕捉等技术不断创新，逐渐取代早期的手绘制作方式。比如2001年发布的《指环王》中国咕噜人，就是用CG和动作捕捉技术创作的。这期间出现了第一个现象级的虚拟数字人：初音未来，3D虚拟偶像。其实初音未来是一个歌曲合成软件。当时Crypton Future Media基于雅马哈的Vocaloid系列语音合成程序开发了音源库，并以此为基础制作销售了虚拟歌手角色的home系列。洛天依，2012年出道的mainland China女虚拟歌手，也是基于雅马哈Vocaloid3的语音合成引擎的虚拟偶像。但无论是“初音未来”还是“洛天依”，都离我们现在看到的虚拟人相差甚远，因为即使有了CG、动作捕捉等关键技术的加持，他们仍然无法实现一个最重要的功能：与人互动，也就是说，虚拟偶像并没有人格化。直到2016年以后，虚拟人才开始越来越像“人”。
这一年，谷歌AlphaGo击败围棋冠军李世石，成为第一个击败职业九段的计算机围棋，人工智能开始进入大众视野。语音识别、自然语音处理、语音合成、语音驱动的人脸动画等技术，以及深度学习算法的突破，为虚拟人的发展提供了技术支持。简单来说，在过去，创建一个虚拟人，动画师和建模师可能需要一个接一个地、一帧接一帧地绘制角色。原画建模后，可以通过实时渲染、实景运动捕捉等技术实现。时间成本和资金成本比较高，主要用在影视娱乐行业，比如数字体双。但是AI技术发展以后，需求方可以直接使用AI完成图像建模和后续的驱动渲染，或者初始的图像建模依靠人力，后续的驱动依靠AI。随着拟人化程度的不断提高，很大程度上简化了生产工艺，降低了生产成本。比如2021年初，虚幻引擎中的开发者Epic Games发布了可以生成高保真角色的工具——超人类创造者(Metahuman Creator)。基于预先制作的高质量人脸素材库，用户可以通过自动混合和手动调整的方式快速生成虚拟人。小团队也可以用这个工具快速生成自己的主角。在此期间，我们看到的虚拟人有常驻主机营的肖扬，会作诗作曲的清华大学虚拟学生华，以及带货新秀阿雅依。
二。行业：谁在做虚拟人？去年“元宇宙”概念火了，给虚拟人带火了。阿雅伊、艾玲、华、肖扬、刘等众多虚拟人物纷纷登场。然后，行业掀起投资热潮。开源证券在一份研究报告中指出，仅2021年下半年，就有近20家相关企业完成融资，其中包括IDG资本、红杉中国、顺为资本等明星投资机构。然而，虚拟人的流行并不仅仅是由“元宇宙”推动的。我们上面说过，AI、深度学习等技术的突破，大大降低了虚拟人的制作门槛，所以技术进步是虚拟人流行的根本推力。尤其是对于完全由AI驱动的虚拟人，最终效果受到语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)、语音驱动的面部动画(ADFA)等技术的影响。换句话说，只有具备了以上的技术要素，一个虚拟人才可以看到、理解、思考、回答和呈现。所以，想要切入这个行业的玩家需要具备以上一项或多项技术能力。目前的数字虚拟人产业链分为三层：
基础层：主要提供建模/渲染引擎等基础软硬件。虚拟人视觉制作的产业化过程包括建模、骨骼绑定、运动捕捉、表面捕捉、渲染、材质计算等环节，需要显示设备、光学设备、传感器等硬件产品，以及建模绑定、渲染引擎等软件产品。这一层做得好的大多是国外公司，比如大家熟知的《王者荣耀》《原神》，就是基于美国Unity公司的渲染引擎打造的。平台：提供软硬件系统、生产技术服务平台、AI能力平台。大部分进入的中国企业都位于这一层。比如商汤、从云、易图和迪法恩斯，AI四小龙，比如在语音识别领域做得比较好的科大讯飞。还需要特别关注百度、腾讯、阿里等大头厂。基于自身在底层技术和硬件架构上的沉淀，在产业链的布局上会相对全面，往往会针对不同行业提供相应的数字化技术服务平台和解决方案。比如网易的伏羲，可以提供游戏行业解决方案、空间智能互动解决方案、文旅虚拟代言人解决方案等。比如阿里有一个AI虚拟模型塔，用在电商上。商家只需要上传一个产品的瓷砖，就可以生成模型的实拍图；例如，百度AI Cloud推出了智能数字人平台——西灵，致力于打造面向演艺的智能服务型数字人，还推出了基于终端实时渲染的虚拟影像智能交互解决方案。应用层：虚拟人应用的每个场景。比如相对成熟的影视、传媒、游戏领域，以及金融、文化旅游等。也是数字虚拟人实现商业化的重要途径。
三。价值：虚拟人的商业化是怎样的？随着虚拟人的不断出现，外界对这个行业的市场前景给出了较为乐观的预测。量子在《数字虚拟人深度产业报告》中预测，到2030年，中国数字虚拟人整体市场规模将达到2700亿元。乐观的背后，首先要明白的是，虚拟人能带来什么价值？这就决定了这个行业的天花板，以及产业链的相关参与者如何商业化。从应用层来看，目前主流的虚拟人可以分为两种：服务虚拟人和身份虚拟人。前者主要用于替代现实生活中的服务，是现实世界中服务型角色的虚拟代表；后者多为虚拟IP/偶像，意在推动虚拟内容的生产，也可以是虚拟世界中用户的第二个分身。
比如获得万科杰出新人奖的员工崔，浦发银行的数字员工小普，都是服务型的虚拟人。他们的出现是为了能够帮助地面上的企业。乐华娱乐的虚拟偶像团体“A-soul”，靠短视频走红的刘，和查理同台演出的，都是基于身份的虚拟人。在应用场景和商业模式上，这两类虚拟人有很大的不同。服务型的人更面向to-b市场，更重要的是如何通过AI赋能企业。经济效益不在于直接创造增量收入，而在于降低劳动力成本。网易福喜营销负责人唐曾公开表示，虚拟人的本质逻辑是降低成本，提高效率，让AI更好地服务人类。因为现实中有很多简单重复的工作，可以用虚拟人代替，而且AI出错的概率比真实员工小，不受空间和时间的限制。对于入驻企业，可以提供成熟的面向服务的虚拟人、一项或多项技术，以及针对不同行业的个性化定制解决方案和服务。这就考验了公司底层的AI实力。比如百度打造的第一个互动虚拟偶像杜潇潇，集合了百度在多模态交互、3D数字人体建模、机器翻译、语音识别、自然语言理解等多项技术的能力，甚至在高考语文作文中获得高分。她创作的画作还可以参加Xi美术学院的毕业展。身份虚拟人更多面向to C市场，目前主要集中在游戏和媒体领域。变现模式主要是打造虚拟偶像或者虚拟IP，先在C端扩大粉丝流量，再通过流量变现。比如小红书出现后一个月，AYAYI就陆续与娇兰、保时捷等国际大牌达成合作。2021年9月，Ayayi成为阿里巴巴首位数字员工，担任天猫超级品牌日数字经理；虚拟玲玲也成为了商业宠儿，与VOGUE、奈雪茶、特斯拉、乐城、KEEP等品牌开展了跨界合作。也就是说，基于身份的虚拟人商业模式的核心是粉丝经济，类似于现实生活中的明星。可以通过品牌推广、代言、参与节目、打赏直播、发行音乐专辑、周边销售等方式实现。其特点是能带来较高的收入增量。乐华娱乐的泛娱乐业务收入从2020年的2110万元增长至2021年的3790万元，主要得益于虚拟艺人团体A-SOUL的商业开发所产生的收入。安信证券估计，A魂贡献了约1700万元的增量收入。不过这类虚拟人的要求会比较高。如何打造一个一线虚拟偶像，并保证其能长期留在一线，并不容易。这考验的其实是品牌对IP和内容的长期运营能力。从更广阔的全球范围来看，在这个层面上，中国落后于欧美。毕竟有太多中国公司想做迪士尼，但最后都是渐行渐远。究其原因，相比国外成熟的IP运营体系，国内娱乐公司已经具备了IP建设的意识，但IP持续更新和运营能力欠缺。虚拟人行业是一个追赶甚至赶超的机会，但是已经在或者即将进入这个行业的公司需要思考的是，他们想要的是短期利益还是长期的数字资产。面对新一轮的IP孵化和商业化机会，这大概会决定他们在这个行业能走多远。

{{userData.name}}已认证

什么叫AI虚拟人(ai虚拟人是什么)

疯狂杀戮！ 1分钟完成100页PPT，天工AI人工智能快速方法！

非常治愈的动画电影(日本治愈动画电影推荐)