
本文正文字数约 2200 字,阅读时间 7 分钟。
与生成文本类的 AI 一样,生成图像类的 AI 依然需要我们编写优质的提示语才能够获得让我们满意的结果。当我们了解了如何构建清晰简洁的提示语之后,才可以充分发挥生成图像类的 AI 所提供的各种风格。
但是生图类 AI 的提示语与生成文本类的 AI 的提示语的规则并不完全相同,生图类 AI 的提示语相对来说会更加复杂,会涉及更多的参数。
所以如果想要能够让 AI 产出让人满意的图像,学习编写优质的提示语是必经之路。
本文将向你详细介绍一条优质的提示语应该包含哪些关键点,以及如何构造出一条优质的提示语。
前提说明
本文示例图像所使用的模型是 https://huggingface.co/stabilityai/stable-diffusion-3-medium。
下图是本文采用的 ComfyUI 工作流,其实就是默认的文生图工作流。
优质提示语的构成
一条优质的提示语,应该包含以下方面:
- • 主题(Subject)
- • 媒介(Medium)
- • 风格(Style)
- • 艺术家(Artist)
- • 分辨率(Resolution)
- • 色彩(Color)
- • 光照(Lighting)
- • 其他细节(Additional details)
主题(Subject)
首先,我们需要对想要生成的图像的主题进行尽可能详细的描述,比如:
A young cool woman wearing a brown coat and carrying an deep cyan umbrella on an old street, black short hair.
很多时候,我们常犯的一个错误是没有足够详细地描述图像。
比如以这条提示语为例,主角穿什么样的衣服?她的发型是什么?她的年龄又是如何?雨伞应该如何描述?
如果不将这些细节描述清楚,AI 就会自行决定这些内容,图像的生成也就不受控制了。
生成的示例图像如下:
媒介(Medium)
所谓媒介,指的就是图像的创作方式或者说创作材料。
比如数字绘画、摄影、油画等,都属于媒介。
下面这张表格列举出了部分示例的媒介。
关键词 | 注释 |
---|---|
Portrait (肖像) | 非常真实的绘画。适用于人物。 |
Digital painting (数字绘画) | 数字艺术风格。 |
Concept art (概念艺术) | 插画风格,2D。 |
Ultra realistic illustration (超现实插图) | 非常真实的插图。适用于人物。 |
Underwater portrait (水下肖像) | 适用于人物。水下场景,头发漂浮。 |
Underwater steampunk (水下蒸汽朋克) | 非常真实的绘画。适用于人物。 |
我们这里使用一个叫做 Digital painting(数字绘画) 的媒介:
A young cool woman wearing a brown coat and carrying an deep cyan umbrella on an old street, black short hair, Digital painting.
可以看到图像的风格已经有所变化了。
接下来,我们将继续添加更多细节。我会在每一章节里为你列出一部分与提示语相关的关键词,你可以使用这些关键词尝试自己生成图像。
艺术家(Artist)和风格(Style)
这里的艺术家指的是历史上比较出名的艺术家,下面这张表格列举出了一部分示例:
关键词 | 注释 |
---|---|
John Collier(约翰·科利尔) | 19 世纪肖像画家。增加优雅感。 |
Stanley Artgerm Lau(斯坦利·阿特杰姆·刘) | 适用于女性肖像,生成 19 世纪精致服装,有一些印象派风格。 |
Frida Kahlo(弗里达·卡洛) | 强烈呈现卡洛肖像风格的效果。有时会生成带画框的作品。 |
John Singer Sargent(约翰·辛格·萨金特) | 适用于女性肖像,生成 19 世纪精致服装,有一些印象派风格。 |
Alphonse Mucha(阿尔丰斯·穆夏) | 阿尔丰斯·穆夏风格的 2D 肖像画。 |
在这里我们采用比如 Stanley Artgerm Lau 这位艺术家。
分辨率(Resolution)
关键词 | 注释 |
---|---|
unreal engine | 非常真实且细致的 3D 效果。 |
sharp focus | 提高分辨率。 |
8k | 提高分辨率,但可能使图像看起来更假。让图像更接近摄影效果,更加真实。 |
vray | 适用于物体、风景和建筑的 3D 渲染。 |
分辨率我们选择 **8k**。 | |
当然,就算我们指定分辨率为 8k,最终得到的并不会是实际的 8k (7680 x 4320) 分辨率的图像。
这个条件主要影响的是图像生成的视觉效果,让图像看起来更加精细或者更具有高分辨率的质感,并不是真正的 8k 输出。
如果我们想要得到更高分辨率的图像,可以在 ComfyUI 中采用诸如 Upscale 这样的方法。
色彩(Color)
关键词 | 注释 |
---|---|
iridescent gold(虹彩金) | 闪亮的金色。 |
silver(银色) | 银色色调。 |
vintage(复古) | 复古效果。 |
色彩我们选择 vintage,也就是复古风格。
光照(Lighting)
关键词 | 注释 |
---|---|
rim lighting(轮廓光) | 物体边缘的光线。 |
cinematic lighting(电影感光源) | 利用光线提升对比度的通用术语。 |
crepuscular rays(曙暮光) | 穿透云层的阳光。 |
光照我们选择 cinematic lighting 和 rim lighting。
其他细节
关键词 | 注释 |
---|---|
silk(丝绸) | 为服装添加丝绸材质。 |
expansive(广阔) | 更开阔的背景,较小的主体。 |
low angle shot(低角度拍摄) | 从低角度拍摄。 |
god rays(上帝光束) | 穿透云层的阳光。 |
psychedelic(迷幻) | 色彩鲜艳且带有扭曲效果。 |
其他细节我们暂时不用选择,组合起来就能得到下面这样的提示语:
A young cool woman wearing a brown coat and carrying an deep cyan umbrella on an old street, black short hair, Digital painting, by Stanley Artgerm Lau, 8k, cinematic lighting, rim lighting, vintage.
由于我们现在是在做人物相关的图像生成,所以需要指定一些 Negative Prompt 来避免在生成人物部位(比如手部或者头部)的时候产生缺陷,Negative Prompt 可以这样写:
deformed hands, extra fingers, missing fingers, distorted fingers, long fingers, blurry hands, blurry, blurry_image, Lowres, Low_resolution, Low_picture_quality, watermark, text, long neck
可以得到下面这样的图像:
编写优质提示语的技巧
这里也总结一下编写优质提示语的技巧:
-
- 详细、具体的描述主题:一定要尽可能地描述主题,外貌、姿势、背景、环境等,都需要细致的描述才能让 AI 领会你的意图;
-
- 使用括号调整关键词的权重
-
- 尝试混合风格:可以尝试着在提示语中添加多个风格元素;
-
- 参考高质量提示语:学习最快的方式就是模仿,可以试着去模仿网上的高质量提示语。
总结
尽管我在本文中列举了一些相关风格的关键词,但是它们可以作为编写提示语的指导,并不是一个固定规则。相对于文本生成,图像生成的灵活性就更好了,我们完全可以通过尝试不同的关键词组合来创作出非常具有创意的图像。
微信赞赏
支付宝赞赏
暂无评论内容