Stable Diffusion是一个重要的AI图像生成模型,其发布标志着AI文本图片生成技术变得更加普及化和易用化。最近,一些人利用该模型对真实人物的图片进行训练,生成的结果足以以假乱真,很难分辨是AI生成还是真实拍摄。如果你对此感兴趣,本文将从头开始教你如何构建一个真人AI网站。本教程分5个目录帮助大家学习搭建本地化Midjourney(Stable Diffusion)
1. 搭建自己的AI网站2. 模型下载安装3. 汉化插件下载安装4. 生成模拟真人图片4.1 生成模拟真人图片4.2 不同风格图片生成4.3 动画视频生成5. 生成的图片开口说话
01:搭建自己的AI网站
第一步,我们可以直接使用 GitHub 仓库:
stable-diffusion-webui
第一步,在你的电脑上安装 python环境,版本 3.10.6,如果已经安装了其他 python 版本,可以利用 conda
安装3.10 的虚拟环境版本:
conda create -n novelai python==3.10.6
下载仓库代码:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
安装对应的GPU 版本的 Pytorch,打开网址:
https://pytorch.org/get-started/locally/
复制对应的命令。
进入刚刚创建的虚拟环境文件夹novelai
执行命令行:
./python -m pip install torch torchvision torchaudio --extra-index-url https://download环境安装成功,测试 pytorch 版本是否可以正确运行
进入下载的 Github 仓库的代码文件夹,安装第三方依赖:
python -m pip install -r requirements.txt
02:模型下载安装
有了网站,还需要下载对应的 AI 模型。有些朋友已经利用大量的图片训练好的模型分享到网站上了,比如:https://civitai.com/这个网站被人们称为「C 站」,里面有很多你意想不到的模型
可以在网站上找到很多已经训练好的模型,找一个生成真人图片的模型:ChilloutMix。从网页上下载对应的模型后,把该模型放到你的工程目录:models/Stable-diffusion。
03:汉化插件下载安装stable-diffusion-webui 这个UI前端框架项目还支持第三方插件,我们可以下载对应的汉化插件。下载地址:
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN登陆上面网站后,就可以下载插件的安装包:
然后将文件解压放到 extensions 目录下:
解压完需要对网页进行重启:
在扩展这里,把插件勾上:
在“设置”选项里,找到 zh_CN,最后需要重新启动网页,就可以生效了:
04:生成模拟真人图片启动主程序'launch.py',等待一会命令行会出现Local URL 复制这个链接到浏览器就可以访问了。
打开网址,有时候可能模型没有更新或者加载完成。因此需要多次尝试,多次重启。需要选择刚刚下载的模型:ChilloutMix。
这样前期需要做的工作就部署完了,接下来详细教大家怎么生成自己想要的图片。
4.1 生成模拟真人图片
在上面提到的网站https://civitai.com/上,有很多网友利用 promt 已经生成许多图片了,我们就可以直接对这些进行参考。找一个好看的图片,对下面的 Prompt 词语进行复制:
其中 Prompt 词语放在提示词框内,消极 Prompt 词语放在对应的方框内。同时调整对应的参数,最后就可以生成真人图片:
4.2 不同风格图片生成
在 https://civitai.com/上,还有很多 Lora 模型可以进行下载。这是一种可以帮助你调整画风的小模型。主要是放到 Prompt 中进行使用。例如我们可以在网站上下载原神的 Lora 模型:
下载完成后,把模型放到 models/Lora 路径下:
按照图片下的步骤,选中模型后,会看到具体的 Prompt 在方框内了:
把步骤 4.1 中的 Prompt 词语加入到这里,就可以生成一个原神风格的图片:
4.3 动画视频生成
首先需要安装插件**“deforum”**,这个插件能够根据多个生成的图片构造成视频动画。
https://github.com/deforum-art/deforum-for-automatic1111-webui在当前 stable-diffusion 目录下,执行下面命令,就会发现 extensions 多了新的插件:
git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extens
同时重启新的网页,会发现导航多了一个 deforum 这个选项:
可以先执行简单的生成,在提示词上,已经默认填写了语句:
{ '0': 'tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera', '30': 'anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong', '60': 'a beautiful coconut --neg photo, realistic', '90': 'a beautiful durian, trending on Artstation'}生成出来的视频如下:
Prompt 词语模板解释如下:
//Abstracted Example{ '0': 'Prompt A --neg NegPompt' '12': 'Prompt B' }
其中“0”和“12”提示在插值中解析的关键帧。Prompt A 和 B 是肯定提示,NegPrompt 是否定提示。当然,也可以直接用上面 C 站下载下来的模型,
生成真人动画
05:生成的图片开口说话
从上面我们已经得到了生成的图片,可以利用这张图片,创建自己的 AI 说话视频。打开网址:https://studio.d-id.com/ ,选择刚刚生成的图片,然后输入自己想要说的话,之后生成就可以了:
最后就可以得到比较逼真的真人 AI 说话视频了。
Stable Diffusion作品
midjourney作品赏析,这创作能力插画师瑟瑟发抖
Midjourney Prompt 关键词的语法结构 & 用后缀参数控制出图比例
如何直接用中文玩 midjourney?划词翻译,实用教学!
联系客服