注1:原则上不建议使用任何未经授权的肖像内容,本文使用互联网公开的杨幂肖像仅限于内部技术交流,与诸位探讨 AI训练方法。大家在进行生产与商业行为时,请务必遵守法律法规。

注2:本文目的在于用最简单的方式,最少的步骤,零参数的模式交流一种Stable Diffusion训练方法,是最简模式,绝非最优模式。

在接触到Stable Diffusion人物模型之后,有些同学想训练一款属于自己的模型,但是训练工具太多,参数五花八门,让人眼花缭乱。本文就从最简单的流程上来实现一次模型训练,简单到什么程度哪?除了几个点选项之外,不用输入任何参数,连触发提示词,学习率那些难懂的参数全都不写。

  • 训练前准备

本训练教程,默认本地或者云端机器已经安装好完整的Stable Diffusion,已经安装dreambooth扩展,并且至少有一款基础模型。

  • 处理训练素材

既然要训练,就要准备足够的训练素材,这里建议50张清晰高质量的照片,照片最好有各个角度。我在百度下载公开的杨幂照片,如下:

格式,文件名,都关系不大,本着最简单的前提,我们现在不做任何人工处理。

然后我们打开sd的训练tab:

这里让sd为我们做一次预处理,把刚才存储杨幂照片的文件夹地址填进入(源目录),再选择一个输出文件夹(目标目录)。然后设置统一处理的宽高,我这里设置为768(你保存的图像至少要大于768*768).

下面点选 blip和deepbooru任意一个,最简训练教程不需要管他们是干嘛的。

然后点击预处理

预处理进度走完以后,右侧会显示

现在打开我们设置的输出文件夹,你会看到:

现在你应该清楚预处理都做了什么,那就是把所有图像按比例处理为768*768,并且裁切掉比例外的部分,同时生成一份图片描述txt文件。

这样就会造成有些图片被切掉了头部

这一类的照片可以选择直接删除,如果你的样品够多的话。

也可以选择手工处理下

全都处理完以后,我们的out输出文件夹里都是比较完美的样本图片了

这里的txt我们也不去处理它,最简流程嘛,多一点我们都不做。

到这一步,处理素材的工作就完成了。

  • 新建模型

处理完素材之后,下一步就是创建一个你自己的模型

打开dream booth选项卡,选择创建,给自己的模型取个名字,并且选择一个基础模型(这里可以选择一款你用着比较顺手的人像模型,如果你训练的是图片,banner等其他图片,也可以选择相应的icon,插画模型)。

顶部灰色框里的模型与本训练无关,可以不关注。

然后点击创建

  • 训练

创建完模型之后,我们就来训练这个模型。

选项卡切换到选择,选择刚才你创建的模型,在中间的设置选项里可以勾选一个使用lora。

往下拉一些,这三个选项:

然后切换到概念tab

点击训练向导-人物,这里他会做一些预设操作,不过我们不用关心。

然后在数据集目录这里,填写我们之前输出的预处理图像out目录

到这一步,训练准备全部完成,点击训练按钮。

训练进度开始走

根据不同的显卡,整个训练过程大概在30分钟到4小时之间

当训练完成之后,你的模型这里刷新可以看到多出了test这个新的模型。

输入一些你以前准备好的人像提示词,试一下。

  • 后记

到这里,整个训练流程就结束了,我们没有去理解任何参数的作用,是一个简单粗暴的训练教程,模型质量只能说一般,但对于想快速拥有一个个人模型的同学,是个最快的过程。如果后面想更细致的优化模型,就要细致的去了解那些参数和功能,以及插件工具了。

  • 常见报错

xformers未安装,是最容易报的错误,网上很多安装方式对新人都不友好,最简单的处理模式,就是在启动参数的时候直接安装

在你的启动命令后面加上 –reinstall-xformers –xformers 

  • 几张产出样品

就算非常完美的模型,也不是生产的每一张图都好用的,必须通过海量生产,来选择自己满意的作品,这里附几张样品图: