GPT4o上线了新的绘图功能,我简单用了几下就真的迫不及待想要分享给大家了。我可以说GPT4o相比之前还在研究drawthings、comfyUI的人都不用研究了,纯自然语言生图可太香了。图片完全可用的底部了,简单修修改改直接用完全可以。

我有一个ip形象叫做“咕哩”,这个形象为了保持元素少、简洁易识别,当时就绘制了2d版本。

角色一致性测试

绘图

可以说是非常简单直接的提示词。输出效果:

出图

这个很好的保持了角色一致性,相比与我觉得最好的国产AI即梦。即梦会把咕哩画成:

炸裂的角色一致性

GPT4o很好的保持了角色的特征。

让我们看个更炸裂的

表情包绘制

表情包绘制

表情包

虽然有几个很怪,但是还是有很多不仅保留了角色一致性,还很好的还原了动作!让他画100个,挑出16个好的一点问题都没有!

角色特征不仅保留,而且非常Q弹。可惜呆毛部分没保留。然后更炸裂的来了,这个出图是

支!持!上!下!文!

之前的出图感觉就是识别成文字然后再创作,或者区域补图,现在已经是完美支持上下文了,他能够理解并创作。

出图要求

好家伙这几乎是完全可用了!相当于Q版形象绘制了。

出图结果

游客照

我一直也没有啥机会出去旅游,那制作点旅游照可不可以呢?

旅游照

我发现出图是可以,但是人脸一致性保持的不是很好。不太像一个人。看来要想可用,还得用其他的换脸模型做辅助。

布达拉宫的游客

但是目前不支持更换为指定人这种。看来有人物审查,怀念Grok的一天。

无法改人

但是对于一些名人效果就很好。

马斯克的碰碰车

马斯克

出图:

出图效果

国外人效果会好一些(不知道是不是因为看其他地方的人长得都一样的关系)

文章配图

我在想可不可以给文章添加一个概要性的图,让用户能够很快理解文章讲什么。我用之前讲秒哒的图来做个例子。

提示词

出图效果:

出图

逻辑是通顺的,但是中文小字就很容易糊。看来这种就不太适用了。不过从逻辑、排版、布局上来看,除了文字以外没有太大的毛病。

海报制作

有一些很精美的海报我很喜欢,但是产品融合进去不知道啥感觉,发给GPT就对了!

海报生成

这种毛茸茸的插画风格真的给移植过来了!不过可惜的是文字布局没移植,不过这东西放PS真分分钟搞定。

海报制作

非常的精致!

像是这种元素融合真的太好玩辣!

雷军顶车模

顶车模

可能他不太能理解手指尖,而且人物确实降低质量了,可惜。不过大体上还是让人满意的。(差强人意)

UI设计概念搞杀手

绘制UI图

确实出了一个UI图。虽然跟规范和基本的概念都不怎么样,但是提供灵感是绰绰有余了。

UI图

那我垫一张UI图呢?基于本身的上下文特性,我又塞了一张图。

塞图

可以发现基于这个UI做出了新的非常接近的UI稿。做PPT狂喜。直接风格迁移。

出图

并且我们可以见到,虽然出的图有一些定制和原图不同的地方,但是元素逻辑都是在的,比如按钮就是圆角矩形,不会出现异常的圆角不同或者直线部分弯曲的情况。说明是真的理解了什么是UI图来画的。

作为灵感提供太香了。

输出教程

因为GPT4o是大模型直接出图,所以他是有知识的。这意味着你不需要详细描述每一部分是什么文字,而是告诉他弄什么就行。

在以前,你去出图的时候需要告诉他每一部分的具体文字是什么,而GPT出图颠覆了这个情况。

漫画生成

我们发现出图有比例限制、中文显示,但是无论是逻辑和内容都完全没问题。目前的状态完全可以设计师AI绘图,然后用PS改字就行了。

漫画

总结

我可以说GPT这次更新将AI出图真正变成了工具。准确的一致性、有逻辑且富有知识。生成的图像、海报都很好用。特别是风格融合和需要保持角色一致性的场景。目前还是有一些小问题,比如小的中文就会胡乱写,比例有限制之类的。但是成功的拉低了作图的门槛,太赞了。

价格

目前免费用户一天可以出3张。

GPT plus合租,有兴趣但没plus可以试试:https://blog.zhheo.com/p/9318975e.html