进化洲数字人工具常见咨询解答汇总1

进化洲数字人常见咨询解答：

1、数字人一键运行包运行环境要求

电脑配置：windows 64位系统，NVIDIA显卡，4G以上显存。主要是显存，不是内存。显卡配置越高，显存越大，生成数字人越好用。AMD显卡不支持。

显卡查看方式：按ctrl+shift+esc，显示任务管理器，点“性能”标签页：

2、收费和免费

一键运行包中，包含3个工具：进化洲照片数字人、SadTalker-Video-Lip-Sync语音驱动视频、SadTalker语音驱动图片。进化洲照片数字人和SadTalker语音驱动图片数字人相比，头部姿态更自然。

其中，进化洲照片数字人需要付费，SadTalker-Video-Lip-Sync语音驱动视频，SadTalker语音驱动图片（运行bat启动），后面两个免费。

付费方式是加入进化洲知识星球，加入后可以注册一台电脑使用软件，软件注册后可永久使用。

暂不支持云电脑的注册。因为注册是绑定一台电脑的硬件信息，而云电脑的硬件信息是经常会变的，会导致注册信息失效。

3、如何安装使用

下载链接，百度网盘：

https://pan.baidu.com/s/1gptVkg-oT89PXJsB7fiT5Q?pwd=yac0

或者123云盘：

https://www.123pan.com/s/fcBzVv-zkDCA.html

下载解压JHZHuman-x.x.x.x.zip，其中x.x.x.x为一键包版本号。如果“升级包”目录中的版本有更新的，则需要升级；如果版本号一致，就不需要升级。

如果是NVIDIA显卡的40系列（含3090），则需要下载“N卡40补丁包”，按其中说明打补丁。

解压密码仍为之前密码，新朋友请在公众号后台发消息：数字人，会自动回复解压密码，建议用winrar解压。

目前升级包对2.0.0.5及以上的版本都适用，已有旧版本的话，不需要重新下载JHZHuman-x.x.x.x.zip，它太大，可以只下载升级包来升级，升级包比较小。

运行程序前，建议设置虚拟内存，更新显卡驱动。

设置虚拟内存：SadTalker 免费数字人常见问题之虚拟内存不足

更新显卡驱动：SadTalker数字人工具-显卡驱动

然后，双击运行目录中的Jinhuazhou.exe即可打开软件。

软件操作介绍参见视频：

4、可以生成多长的数字人视频？速度怎样？

目前主要看显卡的显存大小，显存越大，支持的时长越长。3060显卡，12G显存，大概可以生成90秒视频。图片和原始视频的分辨率低些，可以支持更长的视频生成。

3060显卡，12G显存，生成1分钟视频，需要20分钟时间。注意分辨率越高，越占显存，处理越慢。

语音驱动视频时，原始视频的时长要大于音频时长。

所以数字人的一键运行包，目前只适合做短视频，不能做直播。

5、生成的结果视频脸部模糊怎么办？

生成数字人的过程，其实就是对原始素材中的人脸进行重绘，匹配音频口型，重绘过程会降低分辨率，导致看起来模糊。

可以选择增强方式来修复脸部，face方式比较慢，脸部稍模糊，但无人脸框；face x方式快些，脸部清晰，但有个淡淡的人脸框，只适合绿幕视频。

如果选择增强处理后，对效果仍然不满意，可以考虑使用topaz、codeformer等第三方视频修复工具来处理。

6、数字人处理出错，错误信息中含“ffmpeg 不是内部或外部命令”

需要设置ffmpeg路径：免费数字人-ffmpeg不是内部或外部命令

早期版本需要设置，后面的版本基本不用设置。

7、支持的图片格式

支持PNG、JPG两种格式，在选图片的窗口，文件类型可以改。

8、支持的音频格式

支持wav、mp3两种格式。在选音频的窗口，文件类型可以改。

9、所有的人物图片都可以处理吗？

要注意人物照片需要正面无遮挡，角度不要太偏。合适的图片效果会比较好。

动漫二次元支持得不好，不支持动物形象处理。

10、生成的结果视频在哪里？

数字人生成成功后，结果视频文件栏会显示最终结果视频文件路径。也可以在软件的results目录下看。

11、静默视频是什么意思？

静默视频是根据图片生成的不说话视频，头部有晃动动作，有眨眼动作。

照片数字人暂无法驱动身体、四肢进行动作。全身有动作的，暂时只能是语音驱动视频的模式，原始视频录制时带有动作，语音驱动时主要是改口型。

生成的静默视频，可用于SadTalker-Video-Lip-Sync中做语音驱动视频的原始视频。

12、几种增强方式有什么区别？

none 不增强，处理速度快，人脸模糊

lip 增强唇部，处理速度慢，唇部较清晰

face 增强脸部，处理速度慢，人脸较清晰

face x 增强脸部，人脸清晰，结果视频有淡淡的人脸框，适合绿幕视频

13、语音驱动视频为什么有时候口型不好？

SadTalker-Video-Lip-Sync语音驱动视频生成数字人，原始视频中的人物保持闭嘴，唇形稳定，这样生成的数字人口型效果好些。

14、静默模型1、2、3有什么区别？

静默模型1、2的动作一样，静默模型1适合眼睛大些的，静默模型2适合眼睛大小适中的。

静默模型3相对于静默模型1、2的眨眼频率低些。

---------------------------------------------------

如果这篇文章对你有帮助，请点赞支持，谢谢！

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。