Stable Diffusion
模型分类
- Checkpoint:通过 Dreambooth 训练方式得到的大模型, 特点是出图效果好,但由于训练的是一个完整的新模型,所以训练速度普遍较慢,生成模型文件较大,一般几个 G,文件格式为 safetensors 或 ckpt。
- LoRA:一种轻量化的模型微调训练方法,是在原有大模型的基础上,对该模型进行微调,用于输出固定特征的人或事物。特点是对于特定风格特征的出图效果好,训练速度快,模型文件小,一般几十到一百多 MB,需要搭配大模型使用。
- Textual Inversion:一种使用文本提示来训练模型的方法,可以简单理解为一组打包的提示 词,用于生成固定特征的人或事物。特点是对于特定风格特征的出图效果好,模型文件非常小,一般几十 K,但是训练速度较慢,需要搭配大模型使用。
- Hypernetwork:类似 LoRA,但模型效果不如 LoRA,需要搭配大模型使用。
碎碎念
VAE 模型:用于图像输出
采样算法与调度类型一般搭配使用
LoRA 需要与对应的底模相对应
模型
lu简笔画风卡通模型,Checkpoint 模型
常见分辨率
512 * 512
512 * 768