ComfyUI 是目前最强大且灵活的本地 AI 绘画工作流工具,以其节点式操作和极高的显存效率著称。不同于其他“一键生成”的软件,它允许用户像搭积木一样自由构建图像生成逻辑,广泛应用于高精度商业绘图、视频帧控制及复杂特效合成场景。本教程将带你从零开始,彻底拆解 ComfyUI 的核心逻辑。学完本教程,你将不再依赖预设模板,能够独立搭建专属工作流,精准控制画面细节,真正掌握从新手到精通的进阶之路。
在正式开启节点连接之旅前,请确保完成以下基础环境搭建:
run_nvidia_gpu.bat 即可启动服务。models/checkpoints 文件夹中。启动界面后,默认通常已有一个空白或示例工作流。首先找到绿色的 Load Checkpoint 节点,点击下拉菜单选择你刚才放入的大模型文件。接着,定位到 CLIP Text Encode (Prompt) 节点,这是画面的“导演”。在第一个节点的文本框输入正向提示词(如:1girl, beautiful face, detailed eyes),在第二个节点输入负向提示词(如:bad hands, low quality)。注意:确保模型类型与提示词风格匹配,否则可能导致画面崩坏。

预期结果:系统成功读取模型权重,并准备好接收文字指令。
图像生成始于噪声。添加一个 Empty Latent Image 节点,设置分辨率参数,例如宽度 1024,高度 1024,批量大小 1。随后,连接 KSampler 节点,这是核心的“画笔”。将上一步的模型输出、正负提示词编码以及空潜空间图像依次连线至 KSampler 对应接口。关键参数设置:将 sampler_name 设为 euler,scheduler 设为 normal,步数 steps 设为 20,去噪强度 denoise 保持 1.0。警告:若显存报错,请尝试减小分辨率或批量大小。

预期结果:数据流贯通,KSampler 准备开始迭代去噪过程。
经过采样的仍是潜空间数据,人眼无法直接识别。需要添加 VAE Decode 节点,将 KSampler 输出的 LATENT 连入其输入端,并将模型中的 VAE 端口也连入此处。最后,连接 Save Image 节点,将解码后的 IMAGE 接入。点击右上角的 Queue Prompt 按钮。此时,右侧面板将实时显示生成进度条,并在完成后展示最终图片。

预期结果:一张符合提示词描述的清晰图片生成并自动保存至输出目录。
掌握基础后,以下技巧能让你的效率倍增。首先是安装 ComfyUI Manager 插件,它能让你直接在界面内搜索、安装缺失的自定义节点和模型,解决红色的“缺失节点”报错问题。其次是学习使用"Ctrl+ 拖动”快速复制节点,以及利用组(Group)功能将功能模块折叠,保持工作流整洁。对于专业玩家,建议尝试引入 ControlNet 节点,通过上传线稿或姿态图来精确控制人物动作和构图,这是实现商业化稳定输出的关键。遇到显存溢出(OOM)时,可在启动参数中加入 --lowvram 模式进行应急处理。
回顾全文,我们完成了从环境配置、模型加载、提示词编写到采样解码的全流程闭环。现在的你已具备独立搭建基础工作流的能力。建议接下来的练习方向是:尝试更换不同的采样器对比画质差异,或导入 ControlNet 进行控图实验。想要进一步深造,可关注 ComfyUI 官方 GitHub 仓库及社区分享的高质量工作流文件(JSON 格式),通过拖入文件逆向分析大神们的节点逻辑,这是通往精通的最快路径。