大模型挽救数字人

9月23日，一位闪着数点金色光芒的巨型数字人从钱塘江踏浪而来，一步步跑到第十九届亚运会开幕式主会场，在它点燃主火炬塔的同时也点燃了全球观众的热情。

今年是AI狂奔的一年，也是数字人重新焕发新生命力的一年。伴随着AI技术的成熟应用，虚拟数“智”人将加速奔向大众生活。

数字人需要更普惠

业内人士指出，亚运会上的数字人在技术上其实不难实现，但这个创意却很新鲜，更重要的是对“数字人”这个概念做了重要的推广，数字人的热度再次升温。

数字人不是新鲜词。2021年，元宇宙还是风口，被认为是元宇宙不可或缺一环的数字人也成为资本追捧的宠儿。翻开数据表，2021-2022年，数字人赛道出现57起融资，总金额达44.61亿元。热钱砸过来，数字人借势起跑。

然而，这项技术和产品要实现从小众到大众、从尝鲜者到主流群体的广泛应用，还存在不少障碍和痛点。其中，最难就是权衡“技术性”和“经济性”。

在技术人的眼里，一切努力的指向便是让数字人更像人。

亚运会之前，改编于国产“动漫之光”《异人之下》的同名电视剧也在优酷上映。剧中，数字人厘里一袭黑色旗袍，五官精致，在剧中饰演“二壮”，这是数字演员首次与真人同台竞技，更惊喜的是，其演技竟然让观众难辨真假。

对此，有网友评论称：“以后都没有演员了，全用AI可省钱了。”

可见，从技术上来看，数字人已经能够达到超写实状态了。

数字人公司良胜数字CEO张大胜回忆指出，最初，市面上爆红的数字人大多是Q版（卡通）形象，而从超写实虚拟数字人诞生之日起就绕开了“2D”“卡通”等特点，通过精细设计、技术合成，尽可能贴合真人形象。

但是，3D超写实数字人由于缺少大规模的商用场景，仅凭借小部分B端需求实在难填数字人的烧钱无底洞，于是，数字人开始陷入“寒冬”。

例如，曾经在抖音吸粉无数，拿下超过200个品牌合作的“柳夜熙”，便在高昂的成本和较长的制作周期限制下，热度大降。据悉，为了打造“柳夜熙”，其背后的公司仅制作投入就烧了百万元，制作一条短视频又花了几十万，“柳夜熙”在抖音快两年，一共只发了48条短视频。

小冰公司首席运营官徐元春曾指出，一个3D数字人运营一年可能要花掉五六百万。更要命的是，成本很难砍下来。

“目前虚拟数字人生产、运营成本较高，市场接受度尚低，整个产业发展仍处于起步阶段。”赛迪顾问人工智能产业研究中心高级分析师于凯迪在接受《中国电子报》记者采访时指出，数字人如果要落地到各行各业，就必须兼顾更广大用户的个性化定制需求，且更方便、更普惠。

大模型挽救数字人

直到生成式AI崛起，数字人的命运发生变化。

“过去，数字人受技术限制长得都差不多，而大模型拓宽了用户自定义的自由度。”方凯作为亚运会数字火炬手研发团队负责人，在接受采访时介绍说。

原来，亚运会上的这位巨型数字人是由来自130多个国家和地区的超过1亿名在线“数字火炬手”共同汇聚而成。在巨型数字人完成点火仪式结束后，这些“数字火炬手”还可获得一张数字点火专属证书，镌刻着每位“数字火炬手”独一无二的数字人形象。

为了让“数字火炬手”的数字人达到“千人千面”的效果，方凯团队在研发前期折腾许久，最终把目光投向了生成式AI。

“3D数字人的工作流比2D要复杂非常多，起初内部评估工期，大家都很崩溃。”方凯表示。幸运的是，生成式AI极大提升了效率，拯救了焦头烂额的技术团队。

研发人员一共开发了58个“捏脸控制器”，生成式AI技术可以根据人脸识别，画出数字火炬手的面孔，并生成虚拟形象，且用户可以根据需求自由调整脸型、头发、鼻子、嘴巴、眉毛等。据方凯透露，AI最多提供2万亿种形象搭配。此外，“数字人”研发团队还研发了AI动作捕捉，只需输入少量的真人动作，AI便可驱动数字人自主学习更多动作。

如果好看的外形是数字人的“名片”，那么AI将成为数字人的“内核”。AI赋能数字人，未来能实现文本生成、音频生成、图像生成、视频生成、3D模型生成等功能，延伸到多模态交互功能，进而实现跨维度升级。

在数字人制作方面，AI的接入让其生产成本进一步降低。

今年4月，腾讯发布了AI智能创作助手“腾讯智影”，创作者通过上传少量图片、视频和音频素材，就能得到自己的数字人分身和定制音色，进而快速生成自己的数字人播报视频；此前，百度智能云曦灵通过百度自研的语音、视觉等技术，上传一段真人视频，不到30分钟即可一比一复刻主播……

百度副总裁袁佛玉直言：“随着百度AI算法的突破，能让虚拟数字人制作成本十倍、百倍地下降，还能让虚拟数字人生产周期，从动辄几个月，缩短到小时级别。虚拟数字人的制作成本，将从百万级降低到万元级别。”

“大模型不仅直接降低了3D数字人的制作难度，更为数字人注入了灵魂。”新壹科技CEO雷涛指出，过去3D建模依赖传统CG技术，动作捕捉需要采集真人大量数据，现在在新壹科技自研的依托于视频大模型的数字人工具平台上，算法可以高效生成3D模型，处理面部细节更加逼真。

为了提高数字人的真实度，前段时间英伟达更新了其Omniverse的AI能力，并宣称将进一步引入对生成式AI的支持，用户可以仅凭文本信息自动生成高质量的材料。Adobe Substance 3D艺术和开发团队使用Omniverse USD Composer合作创作了一个虚拟数字人形象。该虚拟角色不仅视效逼真，并且皮肤呈现了真实的光线效果，而生成式AI，则提升了面部表情以及唇形同步的质量。

“大模型对数字人的影响是翻天覆地的。”张大胜表示，公司选择与科大讯飞合作，在星火大模型的基础上，研发小模型，作为3D数字人的“大脑”。“接入大模型能力，数字人将获得'人设’。”他说。

大模型对2D数字人的提效更加夸张。

AI的生成能力天然适配2D数字人。近几个月，市面上出现了许多2D数字人定制工具，逻辑基本一致：只要你输入文案素材，就能生成数字人形象。“我们的2D数字人售价一万元左右，24小时就给你做好了。”雷涛说。

据记者了解，甚至有的2D数字人最低只需几百块便能快速生成。

今年4月，商汤科技发布了“商汤日日新大模型”，演示了2D数字人视频生成平台“如影SenseAvatar”，据称仅需一段5分钟的真人视频素材，就可以生成声音及动作自然、口型准确、多语种精通的数字人分身。

多位从业者在接受采访时，对数字人的未来表示乐观。在他们眼里，技术迭代很快，这会让数字人加速走向大众。

作者丨谷月

来源：中国电子报

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。