打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
进化洲数字人工具常见咨询解答汇总1
userphoto

2023.12.13 北京

关注

进化洲数字人常见咨询解答:

1、数字人一键运行包运行环境要求

电脑配置:windows 64位系统,NVIDIA显卡,4G以上显存。主要是显存,不是内存。显卡配置越高,显存越大,生成数字人越好用。AMD显卡不支持。

显卡查看方式:按ctrl+shift+esc,显示任务管理器,点“性能”标签页:

2、收费和免费

一键运行包中,包含3个工具:进化洲照片数字人SadTalker-Video-Lip-Sync语音驱动视频SadTalker语音驱动图片。进化洲照片数字人和SadTalker语音驱动图片数字人相比,头部姿态更自然。

其中进化洲照片数字人需要付费,SadTalker-Video-Lip-Sync语音驱动视频,SadTalker语音驱动图片(运行bat启动),后面两个免费

付费方式是加入进化洲知识星球,加入后可以注册一台电脑使用软件,软件注册后可永久使用。

暂不支持云电脑的注册。因为注册是绑定一台电脑的硬件信息,而云电脑的硬件信息是经常会变的,会导致注册信息失效。

3、如何安装使用

下载链接,百度网盘:

https://pan.baidu.com/s/1gptVkg-oT89PXJsB7fiT5Q?pwd=yac0

或者123云盘:

https://www.123pan.com/s/fcBzVv-zkDCA.html

下载解压JHZHuman-x.x.x.x.zip,其中x.x.x.x为一键包版本号。如果“升级包”目录中的版本有更新的,则需要升级;如果版本号一致,就不需要升级。

如果是NVIDIA显卡的40系列(含3090),则需要下载“N卡40补丁包”,按其中说明打补丁。

解压密码仍为之前密码,新朋友请在公众号后台发消息:数字人,会自动回复解压密码,建议用winrar解压。

目前升级包对2.0.0.5及以上的版本都适用,已有旧版本的话,不需要重新下载JHZHuman-x.x.x.x.zip,它太大,可以只下载升级包来升级,升级包比较小。

运行程序前,建议设置虚拟内存,更新显卡驱动

设置虚拟内存:SadTalker 免费数字人 常见问题之虚拟内存不足

更新显卡驱动:SadTalker数字人工具-显卡驱动

然后,双击运行目录中的Jinhuazhou.exe即可打开软件

软件操作介绍参见视频:

4、可以生成多长的数字人视频?速度怎样?

目前主要看显卡的显存大小,显存越大,支持的时长越长。3060显卡,12G显存,大概可以生成90秒视频。图片和原始视频的分辨率低些,可以支持更长的视频生成。

3060显卡,12G显存,生成1分钟视频,需要20分钟时间。注意分辨率越高,越占显存,处理越慢。

语音驱动视频时,原始视频的时长要大于音频时长。

所以数字人的一键运行包,目前只适合做短视频,不能做直播。

5、生成的结果视频脸部模糊怎么办?

生成数字人的过程,其实就是对原始素材中的人脸进行重绘,匹配音频口型,重绘过程会降低分辨率,导致看起来模糊。

可以选择增强方式来修复脸部,face方式比较慢,脸部稍模糊,但无人脸框;face x方式快些,脸部清晰,但有个淡淡的人脸框,只适合绿幕视频。

如果选择增强处理后,对效果仍然不满意,可以考虑使用topaz、codeformer等第三方视频修复工具来处理。

6、数字人处理出错,错误信息中含“ffmpeg 不是内部或外部命令”

需要设置ffmpeg路径:免费数字人-ffmpeg不是内部或外部命令

早期版本需要设置,后面的版本基本不用设置。

7、支持的图片格式

支持PNG、JPG两种格式,在选图片的窗口,文件类型可以改。

8、支持的音频格式

支持wav、mp3两种格式。音频的窗口,文件类型可以改。

9、所有的人物图片都可以处理吗?

要注意人物照片需要正面无遮挡,角度不要太偏。合适的图片效果会比较好。

动漫二次元支持不好,不支持动物形象处理。

10、生成的结果视频在哪里?

数字人生成成功后,结果视频文件栏会显示最终结果视频文件路径。也可以在软件的results目录下看。

11、静默视频是什么意思?

静默视频是根据图片生成的不说话视频,头部有晃动动作,有眨眼动作。

照片数字人暂无法驱动身体、四肢进行动作。全身有动作的,暂时只能是语音驱动视频的模式,原始视频录制时带有动作,语音驱动时主要是改口型。

生成的静默视频,可用于SadTalker-Video-Lip-Sync中做语音驱动视频的原始视频。

12、几种增强方式有什么区别?

none 不增强,处理速度快,人脸模糊

lip 增强唇部,处理速度慢,唇部较清晰

face 增强脸部,处理速度慢,人脸较清晰

face x 增强脸部,人脸清晰,结果视频有淡淡的人脸框,适合绿幕视频

13、语音驱动视频为什么有时候口型不好?

SadTalker-Video-Lip-Sync语音驱动视频生成数字人,原始视频中的人物保持闭嘴,唇形稳定,这样生成的数字人口型效果好些。

14、静默模型1、2、3有什么区别?

静默模型1、2的动作一样,静默模型1适合眼睛大些的,静默模型2适合眼睛大小适中的。

静默模型3相对于静默模型1、2的眨眼频率低些。

---------------------------------------------------

如果这篇文章对你有帮助,请点赞支持,谢谢!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
AI数字人离线版来了,解压即用!
数字人黑科技AD
图片 音频秒变视频!西交大开源SadTalker:头、唇运动超自然,中英双语全能,还会唱歌
数字人算法知多少?Wav2Lip和SadTalker技术原理详解
GTX 1170性能超GTX 1080 Ti、2.5GHz、16GB显存?都是假的!
火山引擎虚拟数字人技术与应用
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服