如何为 Stable Diffusion 编写优质的提示语【附关键词列表】-AIGC-AI绘画部落

本文正文字数约 2200 字，阅读时间 7 分钟。

与生成文本类的 AI 一样，生成图像类的 AI 依然需要我们编写优质的提示语才能够获得让我们满意的结果。当我们了解了如何构建清晰简洁的提示语之后，才可以充分发挥生成图像类的 AI 所提供的各种风格。

但是生图类 AI 的提示语与生成文本类的 AI 的提示语的规则并不完全相同，生图类 AI 的提示语相对来说会更加复杂，会涉及更多的参数。

所以如果想要能够让 AI 产出让人满意的图像，学习编写优质的提示语是必经之路。

本文将向你详细介绍一条优质的提示语应该包含哪些关键点，以及如何构造出一条优质的提示语。

前提说明

本文示例图像所使用的模型是 https://huggingface.co/stabilityai/stable-diffusion-3-medium。

下图是本文采用的 ComfyUI 工作流，其实就是默认的文生图工作流。

如何为 Stable Diffusion 编写优质的提示语【附关键词列表】

优质提示语的构成

一条优质的提示语，应该包含以下方面：

• 主题（Subject）
• 媒介（Medium）
• 风格（Style）
• 艺术家（Artist）
• 分辨率（Resolution）
• 色彩（Color）
• 光照（Lighting）
• 其他细节（Additional details）

主题（Subject）

首先，我们需要对想要生成的图像的主题进行尽可能详细的描述，比如：

A young cool woman wearing a brown coat and carrying an deep cyan umbrella on an old street, black short hair.

很多时候，我们常犯的一个错误是没有足够详细地描述图像。

比如以这条提示语为例，主角穿什么样的衣服？她的发型是什么？她的年龄又是如何？雨伞应该如何描述？

如果不将这些细节描述清楚，AI 就会自行决定这些内容，图像的生成也就不受控制了。

生成的示例图像如下：

如何为 Stable Diffusion 编写优质的提示语【附关键词列表】

媒介（Medium）

所谓媒介，指的就是图像的创作方式或者说创作材料。

比如数字绘画、摄影、油画等，都属于媒介。

下面这张表格列举出了部分示例的媒介。

关键词	注释
Portrait （肖像）	非常真实的绘画。适用于人物。
Digital painting （数字绘画）	数字艺术风格。
Concept art （概念艺术）	插画风格，2D。
Ultra realistic illustration （超现实插图）	非常真实的插图。适用于人物。
Underwater portrait （水下肖像）	适用于人物。水下场景，头发漂浮。
Underwater steampunk （水下蒸汽朋克）	非常真实的绘画。适用于人物。

我们这里使用一个叫做 Digital painting（数字绘画） 的媒介：

A young cool woman wearing a brown coat and carrying an deep cyan umbrella on an old street, black short hair, Digital painting.

可以看到图像的风格已经有所变化了。

如何为 Stable Diffusion 编写优质的提示语【附关键词列表】

接下来，我们将继续添加更多细节。我会在每一章节里为你列出一部分与提示语相关的关键词，你可以使用这些关键词尝试自己生成图像。

艺术家（Artist）和风格（Style）

这里的艺术家指的是历史上比较出名的艺术家，下面这张表格列举出了一部分示例：

关键词	注释
John Collier（约翰·科利尔）	19 世纪肖像画家。增加优雅感。
Stanley Artgerm Lau（斯坦利·阿特杰姆·刘）	适用于女性肖像，生成 19 世纪精致服装，有一些印象派风格。
Frida Kahlo（弗里达·卡洛）	强烈呈现卡洛肖像风格的效果。有时会生成带画框的作品。
John Singer Sargent（约翰·辛格·萨金特）	适用于女性肖像，生成 19 世纪精致服装，有一些印象派风格。
Alphonse Mucha（阿尔丰斯·穆夏）	阿尔丰斯·穆夏风格的 2D 肖像画。

在这里我们采用比如 Stanley Artgerm Lau 这位艺术家。

分辨率（Resolution）

关键词	注释
unreal engine	非常真实且细致的 3D 效果。
sharp focus	提高分辨率。
8k	提高分辨率，但可能使图像看起来更假。让图像更接近摄影效果，更加真实。
vray	适用于物体、风景和建筑的 3D 渲染。
分辨率我们选择 8k。

当然，就算我们指定分辨率为 8k，最终得到的并不会是实际的 8k (7680 x 4320) 分辨率的图像。

这个条件主要影响的是图像生成的视觉效果，让图像看起来更加精细或者更具有高分辨率的质感，并不是真正的 8k 输出。

如果我们想要得到更高分辨率的图像，可以在 ComfyUI 中采用诸如 Upscale 这样的方法。

色彩（Color）

关键词	注释
iridescent gold（虹彩金）	闪亮的金色。
silver（银色）	银色色调。
vintage（复古）	复古效果。

色彩我们选择 vintage，也就是复古风格。

光照（Lighting）

关键词	注释
rim lighting（轮廓光）	物体边缘的光线。
cinematic lighting（电影感光源）	利用光线提升对比度的通用术语。
crepuscular rays（曙暮光）	穿透云层的阳光。

光照我们选择 cinematic lighting 和 rim lighting。

其他细节

关键词	注释
silk（丝绸）	为服装添加丝绸材质。
expansive（广阔）	更开阔的背景，较小的主体。
low angle shot（低角度拍摄）	从低角度拍摄。
god rays（上帝光束）	穿透云层的阳光。
psychedelic（迷幻）	色彩鲜艳且带有扭曲效果。

其他细节我们暂时不用选择，组合起来就能得到下面这样的提示语：

A young cool woman wearing a brown coat and carrying an deep cyan umbrella on an old street, black short hair, Digital painting, by Stanley Artgerm Lau, 8k, cinematic lighting, rim lighting, vintage.

由于我们现在是在做人物相关的图像生成，所以需要指定一些 Negative Prompt 来避免在生成人物部位（比如手部或者头部）的时候产生缺陷，Negative Prompt 可以这样写：

deformed hands, extra fingers, missing fingers, distorted fingers, long fingers, blurry hands, blurry, blurry_image, Lowres, Low_resolution, Low_picture_quality, watermark, text, long neck

可以得到下面这样的图像：

如何为 Stable Diffusion 编写优质的提示语【附关键词列表】