好久没试过AI绘画模型了,主要是GPT4o的AI绘画能力太强了,基本上找不到对手,所以也很少去测试别的模型。但是最近一种手办的AI图很火,类似于:

手办图

这种图是如何绘制的呢?其实就是用到了最近非常火的Nano Banana模型。

1
制图中角色的1/7比例的商业化手办,写实风格,真实环境,手办放在电脑桌上,电脑屏幕里的内容为该手办的手绘线框稿过程,电脑屏幕旁放着印有原画的BANDAI风格的塑料玩具包装盒,电脑桌上还有制作手办的工具,如画笔,颜料,小刀等。

关键词修改自知乎

如何使用

目前我用下来体验最好的还是通过Google Al Studio来使用。

Google Al Studio

我们进入studio之后,点击右侧切换模型。

切换模型

选择Nano Banana。

选择模型

如果想要生成手办图,可以直接将角色图和提示词放入即可。

下面介绍几个使用的例子,用于展示一些强大的使用场景。

多机位图

支持输入中文关键词,我直接输入

1
生成这个角色的背部机位图

背部机位

我们就直接可以看到背面了。解决经典段子,老板让大象转过来。各个机位的一致性保持的都很不错。而且生成速度很快,相比GPT来说。GPT虽然一致性保持的还不错,但是生成速度还是太慢了。

侧边机位

修改图片

我们可以用自然语言来更改图片的元素。

更改为西装

真人的修改也完全没问题。

修改衣服

修改后的图片保留了原本的人脸、背景、姿势等信息,只修改了衣服,效果很棒。

衣服修改

因为支持上下文,我们是可以继续现在的这个图片进行修改的。例如我们将镜头拉远,展示全身照。

全身

人物的面部保持的还不错,衣服等信息也得到了保留。例如我们将环境修改一下。

1
环境改成在泳池之中,只有半身漏出水面,浑身湿透,保持现有的服装

水中

浑身湿透没体现出来,但是动作和环境都和关键词描述的相同,脸部控制的还可以。

生成证件照

角度切换的识别不错,人脸控制的也很好。

证件照

工作流

那么将这个工具带到工作流我是推荐几个方向。

因为Nano Banana生成的图分辨率较低,但是创图的自由度很高,速度很快,所以作为底层的AI出图步骤再合适不过。

生成图片之后扩图使用即梦AI的画板进行扩图。

然后再搭配Upscayl或者Topaz Gigapixel Al进行图片的分辨率调整。

总结

以上就是我介绍的Nano Banana的使用方法和几个简单的示例,相信大家已经感受到这个模型的厉害之处了。主要就是十几秒的出图时间吊打GPT,还是推荐试一下。