comfyui 文生图

发布时间:2026/7/2 9:22:17
comfyui 文生图 文章目录开始文生图质量词反向提示词生成的图像开始文生图ComfyUI最开始的模板就是文生图功能Checkpoint:你的AI大模型一般放.safetensors文件。大模型可以在LibLib下载。(当然LibLib好的模型和训练模型都要冲会员也可以搜索你想要的模型名称筛选免费模型)CLIP文本编码器:输入的提示词。图中有俩个上面的文本编码器条件连的是K采样器的正面条件一个连接的是负面条件。所以上面的是正向提示词:你想画什么那另一个便是反向提示词不想出现的画面例如模糊低质作用负责把文字需求转换成AI能懂的信号K采样器整个文生图的关键,绘图工具负责在前空间中形成图片。参数随机种Seed: 图片的身份证号一样。可以随机也可以固定输入数字运行后操作: 随机种是固定(fixed)还是变化(randomize)是增加还是减小。其他参数不变的情况下固定后生成的图片是不会改变的步数降噪的次数迭代了多少步。图上步数为20可以理解成给脏玻璃擦了20下。步数越少图片细节越少甚至模糊。步数越多细节越多。当然过高的步数也不一定是好的comfyui中步数在40以上就不会有过多的变化步数越多生图的时间也会越久。一般生图步数在20~30即可CFG: 主要是控制我们最终图像与提示词的匹配程度。CFG越高则代表我们最终生成的图像与关键词也就越匹配反之CFG过低就会让AI有更多的自由发挥空间。过低可能图像会变形过高可能出现清晰度低。CFG值一般设置为5~8采样器dpmpp_2m和dpmpp_2m_sed这俩采样器是大家测试下来相对而言效果比较好的。除了遇到某些特别说明的大模型需要用到对应的采样器或调度器调度器我们一般使用的是Karras降噪跟图生图中会涉及到质量词质量词汇主体氛围词汇质量词汇比如想要非常清晰并且具有丰富细节的词汇。比如杰作高质量极致的细节主体一个女孩双马尾蓝色头发水手服氛围词汇(环境词汇)教室背景动漫风格越靠前的词汇它的权重越高反向提示词模糊混乱低质量无细节有玩家把这些负面词汇整合成了一个词组包embedding:EasyNegativeV2,生成的图像关键词有关大模型本身的训练集中绝大多数都是动漫模型