深度解析Stable Diffusion AI绘画优化技巧:参数设置与创作流程全攻略

深度解析Stable Diffusion AI绘画优化技巧:参数设置与创作流程全攻略
Stable Diffusion Prompt

AI绘画深层解析与优化提示

AI绘画通过过程进行的是一种「注意力调整」过程,从随机噪声图像入手,逐步实现对Prompt提示词的视觉解析和调整。以下是具体模块解释和优化提示:

一、重要参数解析

1. Sampling steps—重要性和最佳设置

Sampling Steps用于指定图像从随机图像向Prompt提示词目标的调整步数。步数设置至关重要:

  • 步数过少: 绘画结果过于粗糙,细节表现力不足。
  • 步数过多: 每步调整更精确,但生成图像所需时间明显增加,且收益递减。
  • 常用参考值: 20至30步已足够实现清晰且细节丰富的图像,大部分采样器超过50步意义不大。

2. CFG Scale — Prompt的权重

Prompt权重决定图像与提示词的匹配度,权重分为单提示词权重,和全部提示词的权重。全部权重设置过高可能导致色彩过饱和并降低图像质量。权重的选择需要根据实际需求进行调整,以下是一个具体的例子:

  • 案例分析: 如果您希望生成一张“阳光下的樱花树”图像,可以尝试以下提示词设置:
  1. Prompt词例: "cherry blossom tree, sunshine, blue sky, gentle breeze"。(为了更好的编写提示词,可以使用LMU.AI提供的提示词生成助手工具生成提示词)
  2. 单个提示词权重: "cherry blossom tree:10, sunshine:7, blue sky:5, gentle breeze:3"
  3. 理由分析: 设置高权重的“樱花树”确保其作为主要元素的细节表现更突出;阳光作为辅助元素,通过中等权重为整体增添自然光感;蓝天和风和日丽的权重较低,目的是增强画面背景但不喧宾夺主。
  4. 全部提示词权重设置CFG Scale的值。
  • 常用参考值: 5~15之间。
  • 常用值: 7、9、12为三个优化配置值。
  • 优化建议: 如果因权重过高导致画质下降,可以适当增加 Sampling Steps以改善效果。
SD CFG Scale

3. 采样器选择(Sampling method):功能和应用场景

采样器决定AI使用何种算法调整图像,以下是常见采样器及其特点:

  • Euler a: 富有创造力,不同步数会生成风格迥异的图像,超过30~40步增益有限。
  • Euler: 最基础和常见的算法,速度快且结果稳定。
  • DDIM: 收敛速度快,通常20步左右即可达到理想效果。
  • LMS: Euler的改进算法,相对更稳定,30步左右效果最佳。
  • PLMS: LMS的进一步优化版本。
  • DPM2: DDIM的增强版,速度提升约为DDIM的两倍。

二、其他关键参数与设置

1. 外观VAE模型

VAE(Variational Autoencoder)用于美化图像的色彩和细节,主要功能包括滤镜和细节微调:

  • 主要功能:
    • 滤镜:类似于剪映、美图秀秀等软件的滤镜功能,可提升整体色彩饱和度和清晰度。
    • 微调:对生成图像的细节进行精细调整。
  • 常见文件格式: ckpt、pt、safetensors(文件名中通常包含"vae"字样,如"model_vae.ckpt")。
  • 常见文件大小: 100MB~800MB不等。
  • 模型存放路径: sd-webui-aki\models\VAE

2. LoRA模型

LoRA(Low-Rank Adaptation)是一种轻量级微调模型,用于实现特定风格或人物特征的定制:

  • 适用场景: 数据相似度较高的情形下,LoRA模型训练效率更高,可节省大量训练资源。
  • 常见文件格式: safetensors、pt、ckpt。
  • 常见文件大小: 100MB~300MB不等。
  • 模型存放路径: sd-webui-aki\models\Lora

3. 随机种子(Seed)

随机种子决定生成的初始噪声图像,在相同参数下保持种子不变可生成几乎相同的图像:

  • 实际操作步骤:
    1. 在种子选项中输入一个固定的数值(例如:12345)。
    2. 保持种子不变,尝试调整Prompt或其他参数以微调生成结果。
  • 常见应用场景:
    • 图像迭代优化: 确保生成基础一致性,通过调整其他参数细化设计。
    • 批量生成相似风格图像: 使用同一种子,改变部分提示词或其他设定生成主题一致的多张图像。
    • 作品共享与再现: 与他人分享种子值和参数,方便复现相同风格或细节的作品。
  • 优化建议:
    • 如果某个种子在某标签下生成了理想的图像,可保持种子不变,仅微调标签以生成风格一致的图像。
    • 注意:不同显卡型号即使参数一致,生成结果也可能存在差异。例如,10XX和16XX系显卡生成结果差异较大,而20XX系和30XX系显卡可较好复现图像。

4. 放大算法(Upscaling)

在高分辨率(如1024x1024)下直接生成图像可能出现异常,放大算法通过低分辨率生成再逐步放大来优化:

  • 常用算法:
    • ESRGAN_4x:默认推荐算法,适用于大多数场景。
  • 重绘幅度(Denoising Strength): 控制放大后细节调整的程度,范围为0到1。
    • 数值越大,AI调整细节的创意越多,偏离原图的可能性越高。
  • 放大倍数(Upscale By): 控制原始图像宽度和长度的倍增,倍数越高需要的显存也越高。

Read more

国内如何使用GPT4o

国内如何使用GPT4o

因为各种原因,国内无法直接使用OpenAI的ChatGPT-4o 。许多人对此感到困惑:既然GPT-4o在全球范围内备受欢迎,为什么在国内无法直接访问?理由有两个,第一不受监管所以管理部门不让。第二技术竞争,OpenAI不给国内开放。本文将介绍两种使用GPT-4o的方法,帮助用户顺利体验这款先进的AI技术。 使用GPT-4o的两种方法 方法一【较难】: 通过可靠合规的VPN访问OpenAI的官方来使用GPT-4o。这种方式技术门槛较高,通常适合对网络工具有一定了解的用户。在国内,选择合规的VPN服务提供商较为困难,因为许多VPN服务不被政策允许;而对于技术人员而言,可以尝试自建VPN或代理服务。 * 风险:一些VPN服务不符合政策要求,存在被封禁或使用不稳定的可能性。 * 成本:优质的VPN服务通常需要额外费用,而自建VPN虽然可以节省费用,但技术操作较复杂,普通用户没法使用。 综上,通过VPN访问GPT-4o适合少数具备网络技术的用户,但对大多数用户而言,这种方式并不便捷。 方法一: 使用LMU.AI的GPT-40服务 LMU.AI是一家国内提供GPT-4

国内如何使用Google的最新Gemini2

国内如何使用Google的最新Gemini2

众所周知国内用户是无法使用 Google搜索和Google 最新的 AI 工具 Gemini2 。若想体验Google 的 Gemini2 AI,目前有以下两种方法: 方法一【复杂】: 使用Gemini2官网。 1. 假如你会“魔法”,你可以直接打开Gemini官网,在左上角选择“2.0 Flash Experimental”模型,这就是最新的Gemini2,如图: 但此方法的前提是需要使用“魔法”(俗称 VPN网络代理服务)。然而对于大多数人来说,找到合规的 VPN 提供商较为困难;而会技术用户可能会自建代理服务,然而这种方式对普通人而言几乎不可行。 方法二【简单】:通过 LMU.AI 的Gemini2服务。 这是最简单的方法。LMU.AI 提供国内可直接使用的 Gemini 服务,技术门槛较低,适合所有用户。

如何利用 LMU.AI 写出 Stable Diffusion 的高质量 Prompt

如何利用 LMU.AI 写出 Stable Diffusion 的高质量 Prompt

在使用 Stable Diffusion(SD)或 MidJourney(MJ)生成图片时,高质量的提示词(Prompt)能大幅提升效率和效果。本文将通过一个例子,展示如何系统化地构建 Prompt,并介绍如何利用 LMU.AI 的工具来优化提示词编写。 示例:完整提示词构建 以下是一个完整的示例提示词: 1girl, solo, looking at viewer, blush, <lora:children huiben11-20231007:1>, children's picture books, crayon paintings, real color, masterpiece, best quality, extremely detailed, fine details, official

如何编写高质量的 AI 提示词:从基础到高级

如何编写高质量的 AI 提示词:从基础到高级

引言 人工智能技术日益普及的时代,能够编写有效的提示词(Prompt)已经成为一种宝贵的技能。一个精心设计的提示词能够显著提升 AI 输出的质量,使生成的内容更贴合用户需求。这篇文章将从基础知识开始,逐步介绍如何创建和优化 AI 提示词,帮助你更高效地利用 AI 技术。 第一部分:提示词的基础 什么是“提示词”? 提示词是用户输入的一段文字或一组指令,用来引导 AI 模型进行理解和输出内容。例如,“请帮我写一个关于夏季旅游的广告文案”就是一个提示词。通过提示词,用户可以指定所需的内容类型、风格、受众等,从而引导 AI 生成相关信息。 提示词的重要性 提示词的精准性直接影响 AI 输出的质量。一个简明、具体的提示词能够大大减少生成内容的偏差,确保输出结果符合用户预期。例如,一个模糊的提示词可能导致 AI 输出与需求不符的内容,而经过优化的提示词则可以显著提高内容的相关性和实用性。 第二部分:提示词的结构 - CO-STAR