打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
大模型挽救数字人

9月23日,一位闪着数点金色光芒的巨型数字人从钱塘江踏浪而来,一步步跑到第十九届亚运会开幕式主会场,在它点燃主火炬塔的同时也点燃了全球观众的热情。

今年是AI狂奔的一年,也是数字人重新焕发新生命力的一年。伴随着AI技术的成熟应用,虚拟数“智”人将加速奔向大众生活。

数字人需要更普惠

业内人士指出,亚运会上的数字人在技术上其实不难实现,但这个创意却很新鲜,更重要的是对“数字人”这个概念做了重要的推广,数字人的热度再次升温。

数字人不是新鲜词。2021年,元宇宙还是风口,被认为是元宇宙不可或缺一环的数字人也成为资本追捧的宠儿。翻开数据表,2021-2022年,数字人赛道出现57起融资,总金额达44.61亿元。热钱砸过来,数字人借势起跑。

然而,这项技术和产品要实现从小众到大众、从尝鲜者到主流群体的广泛应用,还存在不少障碍和痛点。其中,最难就是权衡“技术性”和“经济性”。

在技术人的眼里,一切努力的指向便是让数字人更像人。

亚运会之前,改编于国产“动漫之光”《异人之下》的同名电视剧也在优酷上映。剧中,数字人厘里一袭黑色旗袍,五官精致,在剧中饰演“二壮”,这是数字演员首次与真人同台竞技,更惊喜的是,其演技竟然让观众难辨真假。

对此,有网友评论称:“以后都没有演员了,全用AI可省钱了。”

可见,从技术上来看,数字人已经能够达到超写实状态了。

数字人公司良胜数字CEO张大胜回忆指出,最初,市面上爆红的数字人大多是Q版(卡通)形象,而从超写实虚拟数字人诞生之日起就绕开了“2D”“卡通”等特点,通过精细设计、技术合成,尽可能贴合真人形象。

但是,3D超写实数字人由于缺少大规模的商用场景,仅凭借小部分B端需求实在难填数字人的烧钱无底洞,于是,数字人开始陷入“寒冬”。

例如,曾经在抖音吸粉无数,拿下超过200个品牌合作的“柳夜熙”,便在高昂的成本和较长的制作周期限制下,热度大降。据悉,为了打造“柳夜熙”,其背后的公司仅制作投入就烧了百万元,制作一条短视频又花了几十万,“柳夜熙”在抖音快两年,一共只发了48条短视频。

小冰公司首席运营官徐元春曾指出,一个3D数字人运营一年可能要花掉五六百万。更要命的是,成本很难砍下来。

“目前虚拟数字人生产、运营成本较高,市场接受度尚低,整个产业发展仍处于起步阶段。”赛迪顾问人工智能产业研究中心高级分析师于凯迪在接受《中国电子报》记者采访时指出,数字人如果要落地到各行各业,就必须兼顾更广大用户的个性化定制需求,且更方便、更普惠。

大模型挽救数字人

直到生成式AI崛起,数字人的命运发生变化。

“过去,数字人受技术限制长得都差不多,而大模型拓宽了用户自定义的自由度。”方凯作为亚运会数字火炬手研发团队负责人,在接受采访时介绍说。

原来,亚运会上的这位巨型数字人是由来自130多个国家和地区的超过1亿名在线“数字火炬手”共同汇聚而成。在巨型数字人完成点火仪式结束后,这些“数字火炬手”还可获得一张数字点火专属证书,镌刻着每位“数字火炬手”独一无二的数字人形象。

为了让“数字火炬手”的数字人达到“千人千面”的效果,方凯团队在研发前期折腾许久,最终把目光投向了生成式AI。

“3D数字人的工作流比2D要复杂非常多,起初内部评估工期,大家都很崩溃。”方凯表示。幸运的是,生成式AI极大提升了效率,拯救了焦头烂额的技术团队。

研发人员一共开发了58个“捏脸控制器”,生成式AI技术可以根据人脸识别,画出数字火炬手的面孔,并生成虚拟形象,且用户可以根据需求自由调整脸型、头发、鼻子、嘴巴、眉毛等。据方凯透露,AI最多提供2万亿种形象搭配。此外,“数字人”研发团队还研发了AI动作捕捉,只需输入少量的真人动作,AI便可驱动数字人自主学习更多动作。

如果好看的外形是数字人的“名片”,那么AI将成为数字人的“内核”。AI赋能数字人,未来能实现文本生成、音频生成、图像生成、视频生成、3D模型生成等功能,延伸到多模态交互功能,进而实现跨维度升级。

在数字人制作方面,AI的接入让其生产成本进一步降低。

今年4月,腾讯发布了AI智能创作助手“腾讯智影”,创作者通过上传少量图片、视频和音频素材,就能得到自己的数字人分身和定制音色,进而快速生成自己的数字人播报视频;此前,百度智能云曦灵通过百度自研的语音、视觉等技术,上传一段真人视频,不到30分钟即可一比一复刻主播……

百度副总裁袁佛玉直言:“随着百度AI算法的突破,能让虚拟数字人制作成本十倍、百倍地下降,还能让虚拟数字人生产周期,从动辄几个月,缩短到小时级别。虚拟数字人的制作成本,将从百万级降低到万元级别。”

“大模型不仅直接降低了3D数字人的制作难度,更为数字人注入了灵魂。”新壹科技CEO雷涛指出,过去3D建模依赖传统CG技术,动作捕捉需要采集真人大量数据,现在在新壹科技自研的依托于视频大模型的数字人工具平台上,算法可以高效生成3D模型,处理面部细节更加逼真。

为了提高数字人的真实度,前段时间英伟达更新了其Omniverse的AI能力,并宣称将进一步引入对生成式AI的支持,用户可以仅凭文本信息自动生成高质量的材料。Adobe Substance 3D艺术和开发团队使用Omniverse USD Composer合作创作了一个虚拟数字人形象。该虚拟角色不仅视效逼真,并且皮肤呈现了真实的光线效果,而生成式AI,则提升了面部表情以及唇形同步的质量。

“大模型对数字人的影响是翻天覆地的。”张大胜表示,公司选择与科大讯飞合作,在星火大模型的基础上,研发小模型,作为3D数字人的“大脑”。“接入大模型能力,数字人将获得'人设’。”他说。

大模型对2D数字人的提效更加夸张。

AI的生成能力天然适配2D数字人。近几个月,市面上出现了许多2D数字人定制工具,逻辑基本一致:只要你输入文案素材,就能生成数字人形象。“我们的2D数字人售价一万元左右,24小时就给你做好了。”雷涛说。

据记者了解,甚至有的2D数字人最低只需几百块便能快速生成。

今年4月,商汤科技发布了“商汤日日新大模型”,演示了2D数字人视频生成平台“如影SenseAvatar”,据称仅需一段5分钟的真人视频素材,就可以生成声音及动作自然、口型准确、多语种精通的数字人分身。

多位从业者在接受采访时,对数字人的未来表示乐观。在他们眼里,技术迭代很快,这会让数字人加速走向大众。

作者丨谷月

来源:中国电子报

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
全演艺圈明星都在关注的视频大模型是什么样子的?
【周五】如何用万彩AI生成数字人动画
别再狂吹数字人了
AIGC的“含科量”与“含资量”
谷歌的AI有意识,中国的AI“懂开车”?
一键生成虚拟数字人视频的创作神器,视频博主必备,不出镜口播
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服