Stable Diffusion 是一种开源的基于文本的图像生成模型,可以根据任何文本输入生成逼真的图像。它使用了一种叫做潜在扩散模型(LDM)的扩散模型(DM),这种模型可以逐步去除训练图像上的高斯噪声,从而得到对应的图像。该模型是在 LAION-5B 数据集中的图像上训练的。它由 CompVis、StabilityAI和RunwayML 开发。提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言。本手册将帮助您学习基本的提示词构建规则,更多提示词和免费Stable Diffusion请前往zhituji.cn查看。提示词的内容和格式在构建提示词之前我们需要明确自己的目的,可以向自己提出以下几个问题:1、我想要的图片类型是什么?照片、插画还是油画2、图片的主题是什么?人、动物还是风景3、是否还需要什么细节描述?
a) 所处环境?室外、室内、太空、水下
b) 灯光效果?柔和、霓虹、强光
c) 配色方案?柔和、阴暗、阳光
d) 构图角度?正面、侧面、背面
e) 背景?纯色、森林、城市
4、是否指定特定的风格?3D、电影、动漫、国风5、如果是艺术作品,是否需要特定艺术家的风格?6、如果是照片,是否需要特定的照片类型?长焦、微距、鱼眼当然,这些只是一张图片必须明确的几个因素,只有具备这几个因素才能算是一张合格的图片,而想要生成一张完美的图片还需要更多的修饰词。我们必须在实际操作中试验更多具体的修饰词,并找出自己喜欢的记录下来。注意:在多个提示词组成的词组中,单个提示词越靠前就越重要,会在生成图中突出显示。另外,我们在构建提示词时,应尽量使用单独的单词,而不是将其构建成一个句子。A painting ,a cute goldendoodle wearing
a suit, natural light, in the sky, with bright colors, by Studio Ghibli这里狗狗背景并没有天空下,这时候我们“in the sky”前移,重新生成,就是下图的效果。A painting of a cute goldendoodle in the sky, wearing a
suit, natural light, with bright colors, by Studio Ghibli
提示词的修饰关键词
修饰关键词是可以改变图像的风格、格式或视角的词。添加具体详细的修饰词可以大大提高图像的质量。Tiny cute boy holding camera toy, standing
character, soft smooth lighting, soft pastel colors, skottie young, 3d blender
render, polycount, modular constructivism, pop surrealism, physically based
rendering, square image
摄影照片
摄影照片常用提示词照片类型:Close-up、 Extreme
Close-up、 POV、 Medium shot、 Long shot照片风格:Polaroid、Monochrome、 Long exposure、Color
splash、 Tilt-shift灯光:Soft、 Ambient 、Ring 、Sun 、Cinematic环境:Indoor、 Outdoor 、At night 、In the park、 Studio使用镜头:e-angle、Telephoto 、24mm、 EF 70mm、 Bokeh使用设备:iPhone、 Surveillance
cameras、 Nikon Z FX、 Canon 、DroneClose-up polaroid photo, of a husky, soft
lighting, outdoors, 24mm Nikon Z FX
艺术形式
我们可以通过添加不同的艺术形式提示词生成特定艺术形式的图像。如:涂鸦(Graffiti)、水彩画(Water Colors)、油画(Oil Painting)、水墨画(ink painting)、素描(sketch)、铅笔画(Pencil Drawing)、雕塑(sculpture)等等。ink painting sun mountains water fisherman holding a boat
艺术家
可以将艺术家的名字作为提示词,生成对应艺术家风格的图像,也可以将多个艺术家混合起来生成独特的风格,同样的提示词添加不同艺术家之后可能会生成完全不一样的作品。Stable Diffusion中收录的部分艺术家:肖像艺术家:Derek Gores, Miles Aldridge, Jean
Baptiste-Carpeaux, Anne-Louis Girodet景观艺术家:Alejandro Bursido, Jacques-Laurent
Agasse, Andreas Achenbach, Cuno Amiet漫画艺术家:Makoto Shinkai, Katsuhiro Otomo, Masashi
Kishimoto, Kentaro Miura科幻艺术家:Chesley Bonestell, Karel Thole, Jim
Burns, Enki Bilal摄影艺术家:Ansel Adams, Ray Earnes, Peter Kemp,
Ruth Bernhard概念艺术家:Emerson Tung, Shaddy Safadi, Kentaro
Miura例:肖像艺术家Portrait by Miles AldridgePortrait by Derek Gores风景艺术家Landscape by Cuno Amiet Landscape by Alejandro Burdisio两个艺术家风格混合Portrait by Derek Gores and Miles
Aldridge
插画
Stable diffusion可以创建任何风格、任何形式的插画,包括各种风格的3D插画、甚至设计3D角色(只要输入的提示词足够清晰)。常见插画图像提示词:(3D)origami、Needle felted、Isometric assets、Low Poly、Pixar Renders、3D Item Render;(非3D)Children’s
book、Vector、Scientific
Illustration、Comic、Propaganda
Poster、Movie Poster、Psychedelic
Art、Splash Art、Ukiyo-e、Stickers、Fantasy Mapskawaii low poly squirrel character, 3d
isometric render, white background, ambient occlusion, unity engine 3d fluffy Lion, closeup cute and adorable,
cute big circular reflective eyes, long fuzzy fur, Pixar render, unreal engine
cinematic smooth, intricate detail, cinematic
氛围修饰词
在Stable Diffusion中一两个简单的氛围修饰词,就能改变整幅图像的色调和氛围感。常见的情绪提示词:(积极)Cosy、Romantic、Joyful、Energetic、Hope、Lust、Peaceful、Satisfaction、(消极)Depressing、Loneliness、Grim、Regret、Suffering、Hopelessness、Fear、DisgustCute sad girl toy, curly hair, standing
character, soft smooth lighting, soft pastel colors, skottie young, 3d blender render,
polycount, modular constructivism,
physically based rendering, square image
一些表示清晰度和具体风格的词可以使图像出现巨大的变化和提升。常见提示词:HDR, UHD, 4K, 8k, 64K、Highly detailed、Studio lighting 、Professional、Trending on artstation、Unreal engine、Vivid Colors、Bokeh 、High resolution scan、Sketch、PaintingA cinematic film still of Morgan Freeman
starring as 50 Cent, portrait, 40mm lens, shallow depth of field, close up,
studio lightingA cinematic film still of Morgan Freeman
starring as 50 Cent, portrait, 40mm lens, shallow depth of field, close up