Stable Diffusion 是目前最强大的开源 AI 绘画模型之一,它能将文字描述瞬间转化为高清图像,广泛应用于游戏原画设计、电商素材生成及艺术创作领域。本教程专为零基础用户打造,将从环境搭建到参数调优进行全流程拆解。学完本指南,你将不再依赖付费平台,能够独立部署本地绘图环境,精准控制画面风格与构图,真正掌握从“提示词工程师”到"AI 艺术家”的核心技能。
在开始创作之前,请确保您的硬件和知识储备满足以下要求,这是流畅运行模型的基础:
首先我们需要启动操作界面。如果您使用的是整合包,双击运行run.bat即可;若是手动部署,请在终端输入python launch.py --xformers启动。启动成功后,浏览器会自动打开本地地址(通常为http://127.0.0.1:7860)。注意:首次启动下载依赖项耗时较长,请耐心等待进度条走完,切勿强制关闭窗口。
预期结果:成功进入 Stable Diffusion WebUI 主界面,看到文生图(txt2img)选项卡。
点击界面左上角的模型刷新按钮,选择您刚才下载的大模型(Checkpoint)。接着设置核心参数:在“采样方法”中选择DPM++ 2M Karras,这是目前平衡速度与质量的最佳选择;将“迭代步数(Steps)”设定为20-30之间;“图片分辨率”建议初学者设为512x768或832x1216(针对 SDXL 模型)。

关键点:分辨率必须与模型训练尺寸匹配,否则容易出现多头或多肢体的崩坏画面。
在正向提示词框输入画面主体,例如:1girl, blue eyes, white dress, cherry blossoms, masterpiece, best quality;在负向提示词框填入通用负面词:nsfw, lowres, bad anatomy, worst quality, low quality。点击下方的“生成(Generate)”按钮。
注意事项:提示词权重可通过(keyword:1.2)格式调整,数值越大该特征越明显。生成过程约需 5-10 秒,取决于显卡性能。
预期结果:右侧预览区呈现一张符合描述的精美插画,若无异常,恭喜您完成了第一张 AI 作品。

掌握基础后,以下技巧能让您的作品质感飞跃:
Canny(边缘检测)或OpenPose(姿态控制),可让 AI 严格遵循您指定的构图和人物动作,解决“抽卡”随机性过大的问题。Hires. fix,设置重绘幅度为0.3-0.4,放大倍数为2x。这能在保留原图构图的基础上,大幅增加面部和衣物细节。--medvram,或降低批次数量(Batch count)至 1。回顾全文,我们完成了从环境配置、模型加载、参数设定到提示词编写的完整闭环。建议您接下来尝试不同风格的模型(如二次元、写实摄影),并重点练习 ControlNet 的组合使用。想深入深造?请访问官方 GitHub 仓库查阅最新插件文档,或在专业社区分享您的作品以获取反馈。动手实践是精通的唯一路径,现在就开始您的创作之旅吧!