现在出一个AI绘画其实已经为时过晚了,特别是stable diffusion的教程也是已经烂大街了。不过为什么现在才出呢。其实主要是我认为现在是最佳的时期。去年以及前年的学习入门,比较适合一切喜欢尝鲜,热与尝试的人。今年入门,又适合去简单用用gpt、文心一格等。但是你如果想要实际落地,真的要去使用AI绘画,在当下,真的是需要本地的AI绘画stable diffusion。他是最可控的,最自由的。

drawthings作为在mac端/iPad/iPhone的绘画软件,主要推荐的原因是mac使用的是核显。所以内存即显存,可以非常方便的运行各种模型,通过drawthings的加速,让整个AI绘画在端侧实现低功耗和高性能。

那么在开始之前,我们确定一些事情。

  • 使用M芯片的Mac(内存容量建议在16G以上,越高越好)如果实在没有的话,那就iPad和iPhone作为简单学习手段。
  • 已经通过App Store安装了drawthings
  • 从未接触过stable diffusion

这个第一篇教程只适用于从未接触过stable diffusion的小伙伴。帮助大家树立信心。

学本地AI绘画有啥用

你可以将AI绘画想象成一个游戏。一个关键词游戏。通过不同的关键词、模型等的参数分配,你可以实现非常有趣的游戏体验。这是其他学习知识很难做到的。比较像练习武功,武功越强,绘图越漂亮,并且可以通过社交媒体分享立即形成正反馈,都是让人很有动力的事情。

很多人将AI绘画比做了技能,各种释放焦虑说必须要去学习,不学就会淘汰之类的。其实你不学,淘汰的就是这群卖课的了。AI绘画最终总会走向会说话就能出图、改图,你完全可以不用学习,只需要耐心等待,技术总会有人做成并成熟,你只要到时候去尝试就好了。

那说了这么多为啥还要看这个教程呢,其实主要当下已经是一个恰到好处的学习节点。SDXL让自然语言描述成为了可能,LCM可以让性能要求大幅度降低。非常多的技术百花齐放,让本地AI绘画已经变得容易到1天上手、3天熟练、7天精通的程度了。下次的质变应该就是人人都能用的情况了。

很多人去学midjourney、GPT4出图、文心一格。其实他们总会有或多或少的限制,比如midjourney不支持精细控制、GPT4出图一次只能一张、文心一格质量不尽如人意还很贵。

通过stable diffusion,通过drawthings,这个的门槛就被拉到很低了。stable diffusion几乎没有限制,所以你可以自由的生产你想要的敏感图片、定制图片。并且人人都可以上手。这不是一个很困难的事情。你只需要打破开始的艰难,自然而然你就会沉迷其中。

所以最后帮助大家的一些忠告:

  • 这不是学习,而是游戏,游戏内容就是你输入关键词,然后自动抽卡
  • 不要将工作内容作为出图目的,而是将自己喜欢的事物和内容作为出图目的。如果你想出敏感图片,就以它为目的。比如喜欢美女图片,那么就专门去研究怎么出美女图,不断的优化关键词、调整姿势、不断抽卡。
  • 这个AI绘画游戏上手难度很低,游戏性和效果拉满。

所以,之所以推荐所有人都尝试AI绘画,并不是因为你将成为一个AI画师、设计师。本质上我是再给你推荐一款游戏,一个很好玩的抽卡游戏。

这个教程将会是系列教程,我尽可能避免原理等深层知识,我认为学习原理的时机是在已经掌握了之后再查漏补缺。比较像游戏,你逐步可以发现原理和更深层的东西,更有成就感。

游戏玩法

在游戏初期,我们暂时只需要掌握下面四种。

提示

  • 模型:这是出图的基石
  • Lora:这是出图的插件
  • 提示词:这是出图的内容
  • 负面词:这是出图的禁忌

我们可以这样理解,一栋大楼的建立,模型作为大楼的混凝土,表明大楼用了什么材料,提示词和负面词是设计是,表明我们要建造大楼,Lora作为涂料,用来修饰大楼的外观。

另外还有一个常用的小伙伴controlnet控制器,这个可以控制要设计成什么样,这个我们后面单独说。

这里面,模型我们可以固定下来,Lora可以从网上挑选风格下载,提示词和负面词就是我们主要操作的对象。负面词我们动的比较少。所以主要还是关键词、Lora的强度调整等。这就是这个游戏最主要的玩法了。

模型

第一次使用软件会有新手引导界面,选择SDXL Turbo 8bit即可。

我们首先选择一个合适的模型。drawthings是中文界面,所以我们也比较容易找到功能的位置。

我们在模型搜索SDXL

SDXL

我们直接选用SDXL Turbo 8bit ,选择之后点击下载即可。

下载模型

SDXL是新出的一个高质量sd模型,更强的自然语言理解和更好的出图质量。

SDXL Turbo是刚出的一个高速绘制SDXL图片的模型。

我建议大家选择SDXL系列,考虑到速度问题,这个教程主要通过SDXLTurbo来进行。

至于很多教程提到过的SD1.X,SD2.X。其中2.X由于不太好的过滤器等不太推荐,1.X因为有大量Lora所以也可以尝试。不过我们先不着急,可以先按照本篇文章先出一个图再说。

8bit模型出图质量可能有一些差异,不过8bit更加省内存和磁盘空间。

配置

我们配置了SDXL Turbo

然后图像尺寸选择了768x768

步数改为1-4之间,我选择了4

采样器选择LCM

文本指导在1-2之间,我选择了1.5

采样器

关键词

设置好了配置选项,我们输入关键词,可以通过翻译软件。我们以一个戴眼镜的猫为例子。

1
A lovely cat, the cat wears glasses

出图

我们可以看到在不输入负面提示词、纯自然语言翻译的情况下,也可以有不错的效果。相比stable diffusion1.5容易上手多了。

风格

我们可以通过样式模板来选择自己喜欢的风格,而无需手动输入风格关键词。

选择风格

这样我们就可以绘制特定风格的小猫了。

风格化

保存你的作品

上方可以选择一次出图数量,最高100,我们可以设置多个,然后将电脑放在一边,静静等待成果。下方有保存按钮。

界面介绍

第一课总结

我们有了一个非常高的开始,我们无需去学习命令行的使用、处理各种错误、去网站下载模型。通过当然drawthings我们有了一个非常快的开始,去除下载时间的话,我们从打开软件到绘制第一张图可能用不上五分钟。

我们有了非常好的开始,去尝试修改关键词和样式模板生成一些其他有趣的内容吧。也尝试一下我们最初想要的图像目标,如果生成的不尽如人意,不要担心,我们未来还有更多的方法。这仅仅是个开始。

挑战

可以尝试生成

  • 一只猫在树上爬
  • 在夕阳下的奔跑
  • 一栋古罗马建筑