[AI抢饭碗系列]之摄影师-MJ新模型v4评测2
北邦

发布于 2022-11-07 11:39

世事难料,但人的需求总是复杂而多层的,不同的人看到不同的风景。有人看到惊艳自然也有人看到问题。

AIGC背后的大模型就如同大海,谁都可以从中取一瓢饮,但不同的区域不同的味道,也就有了完全不同的评测结论。

今天再来测评一下写实方面的性能。根据官方自己的申明及多数人反馈来说,新版v4大模型无疑更趋向于写实性了。不少人觉得越来越和SD(stable diffusion)接近了,其实也未必是两者在趋近,而是我们共同的现实基础就是这个物理世界,一切来源于此,更大体量的数字资料也是以此为基准的。所以这是一个大模型的基础,一个底层建设,是AIGC要走向商用的基本环境建设,我们就把它当大基建底层吧。AIGC要有大发展必然离不开这个底层建设,是商用基础,也将是吸引资本关注的重要依据。一旦有了大量商业应用的可能性,资本就会汇聚起来,前几天在一个群里看到有人在感叹,现在AIGC要融资很容易的,连一些QQ群要资本赞助算力也很方便。只要是AIGC相关,好像有某种吸引力,资本愿意不顾脸面地贴上来。而这一切其实就是AIGC的整个底层商用环境的成熟,我们还是要明白其高低取舍,不必为一些局部而感叹。

扯了一大堆,还是进入正题。

今天来评测MJ新模型的摄影方面。主要测了两个截面,一个是商业摄影,另一个是臆想型题材,也就是天马行空的想象。这两者是有矛盾之处的,以此来看大模型的性能可见其张容度。

(1)


一些食物类摄影效果很惊艳,昨天在某群中看到某君捞出一些很优质的食物摄影就心中一动,才有了这个评测摄影的心思。
食物摄影评测捞图如下:

(2)


然后是一组动物拟人肖像,这个也是模仿西班牙摄影师Yago Partal的作品思路,但没有把西班牙摄影师Yago Partal的名字直接写入prompt,只是描述拟人动物肖像。由此看到的效果确实很不错,但同时也确实看到新模型有类似过拟合(专业术语:指与模型参考的原稿过于相似而导致侵权嫌疑)问题。

以上是写实部分的实测,确实效果很强悍。

(3)

以下为臆想型题材的实测,明显就很难如上这般丝滑了,就如同戳到了新模型的痛处,效果磕磕巴巴的,看得出极为吃力。

一组还算比较写实的丧尸+时尚模特的图:就把它叫做《丧尸时尚》,效果还是不错的,保持了之前的优质感和丝滑感。

第二组试着生成漫威角色+时尚先生的感觉,但效果就比较一般了

(4)

最后是一些比较飞的想象,这就直接戳到MJ新模型的老腰疼了。

从半复活的兵马俑开始到兵马俑挺进威尼斯水城、到水淹自由女神像、到水淹长城、水淹外滩、到四川火锅里的自由女神等等。语义转成画面基本都做到了,这也是一再获得确认的结论:新模型增强语义理解这个部分,但细节成像品质和叙事精彩度就很人失望了。

水淹自由女神

水淹外滩

水淹长城

当自由女神遭遇四川火锅

如果前面的叙事还算合情合理的话,这一组就彻底翻车啦~

虽然画面有些辣眼睛,但又有种魔幻现实的黑色幽默感

总体而言,写实摄影方面的叙事性能挺强悍的,现实中足够丰富的题材出品很惊艳。而比较飞的想象力画面成品率较低,取决于是否在审美兼容度之内,超出自然成像太远的也能拼凑出来,但美不美就不能保障了。这样就需要有艺术家风格化的方式来弥补,加上艺术家风格化等描述,应该可以从另一个视角达成既符合语义内容又能兼顾人类美学。比如达利这样的超现实主义,zb大神那样的暗黑恐怖美学的渲染...这个部分的平衡永远创作空间中最有趣也最难以把握的地方了。

编辑于 2022-11-11 23:39
打开APP DoDo提供建站支持