深度解析Stable Diffusion AI绘画优化技巧:参数设置与创作流程全攻略
AI绘画深层解析与优化提示
AI绘画通过过程进行的是一种「注意力调整」过程,从随机噪声图像入手,逐步实现对Prompt提示词的视觉解析和调整。以下是具体模块解释和优化提示:
一、重要参数解析
1. Sampling steps—重要性和最佳设置
Sampling Steps用于指定图像从随机图像向Prompt提示词目标的调整步数。步数设置至关重要:
- 步数过少: 绘画结果过于粗糙,细节表现力不足。
- 步数过多: 每步调整更精确,但生成图像所需时间明显增加,且收益递减。
- 常用参考值: 20至30步已足够实现清晰且细节丰富的图像,大部分采样器超过50步意义不大。
2. CFG Scale — Prompt的权重
Prompt权重决定图像与提示词的匹配度,权重分为单提示词权重,和全部提示词的权重。全部权重设置过高可能导致色彩过饱和并降低图像质量。权重的选择需要根据实际需求进行调整,以下是一个具体的例子:
- 案例分析: 如果您希望生成一张“阳光下的樱花树”图像,可以尝试以下提示词设置:
- Prompt词例: "cherry blossom tree, sunshine, blue sky, gentle breeze"。(为了更好的编写提示词,可以使用LMU.AI提供的提示词生成助手工具生成提示词)
- 单个提示词权重: "cherry blossom tree:10, sunshine:7, blue sky:5, gentle breeze:3"
- 理由分析: 设置高权重的“樱花树”确保其作为主要元素的细节表现更突出;阳光作为辅助元素,通过中等权重为整体增添自然光感;蓝天和风和日丽的权重较低,目的是增强画面背景但不喧宾夺主。
- 全部提示词权重设置CFG Scale的值。
- 常用参考值: 5~15之间。
- 常用值: 7、9、12为三个优化配置值。
- 优化建议: 如果因权重过高导致画质下降,可以适当增加 Sampling Steps以改善效果。
3. 采样器选择(Sampling method):功能和应用场景
采样器决定AI使用何种算法调整图像,以下是常见采样器及其特点:
- Euler a: 富有创造力,不同步数会生成风格迥异的图像,超过30~40步增益有限。
- Euler: 最基础和常见的算法,速度快且结果稳定。
- DDIM: 收敛速度快,通常20步左右即可达到理想效果。
- LMS: Euler的改进算法,相对更稳定,30步左右效果最佳。
- PLMS: LMS的进一步优化版本。
- DPM2: DDIM的增强版,速度提升约为DDIM的两倍。
二、其他关键参数与设置
1. 外观VAE模型
VAE(Variational Autoencoder)用于美化图像的色彩和细节,主要功能包括滤镜和细节微调:
- 主要功能:
- 滤镜:类似于剪映、美图秀秀等软件的滤镜功能,可提升整体色彩饱和度和清晰度。
- 微调:对生成图像的细节进行精细调整。
- 常见文件格式: ckpt、pt、safetensors(文件名中通常包含"vae"字样,如"model_vae.ckpt")。
- 常见文件大小: 100MB~800MB不等。
- 模型存放路径:
sd-webui-aki\models\VAE
2. LoRA模型
LoRA(Low-Rank Adaptation)是一种轻量级微调模型,用于实现特定风格或人物特征的定制:
- 适用场景: 数据相似度较高的情形下,LoRA模型训练效率更高,可节省大量训练资源。
- 常见文件格式: safetensors、pt、ckpt。
- 常见文件大小: 100MB~300MB不等。
- 模型存放路径:
sd-webui-aki\models\Lora
3. 随机种子(Seed)
随机种子决定生成的初始噪声图像,在相同参数下保持种子不变可生成几乎相同的图像:
- 实际操作步骤:
- 在种子选项中输入一个固定的数值(例如:12345)。
- 保持种子不变,尝试调整Prompt或其他参数以微调生成结果。
- 常见应用场景:
- 图像迭代优化: 确保生成基础一致性,通过调整其他参数细化设计。
- 批量生成相似风格图像: 使用同一种子,改变部分提示词或其他设定生成主题一致的多张图像。
- 作品共享与再现: 与他人分享种子值和参数,方便复现相同风格或细节的作品。
- 优化建议:
- 如果某个种子在某标签下生成了理想的图像,可保持种子不变,仅微调标签以生成风格一致的图像。
- 注意:不同显卡型号即使参数一致,生成结果也可能存在差异。例如,10XX和16XX系显卡生成结果差异较大,而20XX系和30XX系显卡可较好复现图像。
4. 放大算法(Upscaling)
在高分辨率(如1024x1024)下直接生成图像可能出现异常,放大算法通过低分辨率生成再逐步放大来优化:
- 常用算法:
- ESRGAN_4x:默认推荐算法,适用于大多数场景。
- 重绘幅度(Denoising Strength): 控制放大后细节调整的程度,范围为0到1。
- 数值越大,AI调整细节的创意越多,偏离原图的可能性越高。
- 放大倍数(Upscale By): 控制原始图像宽度和长度的倍增,倍数越高需要的显存也越高。