[AI抢饭碗系列]之摄影师-MJ新模型v4评测2- 爱智岛（人工智能创作联盟）

[AI抢饭碗系列]之摄影师-MJ新模型v4评测2

北邦

发布于 2022-11-07 11:39

世事难料，但人的需求总是复杂而多层的，不同的人看到不同的风景。有人看到惊艳自然也有人看到问题。

AIGC背后的大模型就如同大海，谁都可以从中取一瓢饮，但不同的区域不同的味道，也就有了完全不同的评测结论。

今天再来测评一下写实方面的性能。根据官方自己的申明及多数人反馈来说，新版v4大模型无疑更趋向于写实性了。不少人觉得越来越和SD(stable diffusion)接近了，其实也未必是两者在趋近，而是我们共同的现实基础就是这个物理世界，一切来源于此，更大体量的数字资料也是以此为基准的。所以这是一个大模型的基础，一个底层建设，是AIGC要走向商用的基本环境建设，我们就把它当大基建底层吧。AIGC要有大发展必然离不开这个底层建设，是商用基础，也将是吸引资本关注的重要依据。一旦有了大量商业应用的可能性，资本就会汇聚起来，前几天在一个群里看到有人在感叹，现在AIGC要融资很容易的，连一些QQ群要资本赞助算力也很方便。只要是AIGC相关，好像有某种吸引力，资本愿意不顾脸面地贴上来。而这一切其实就是AIGC的整个底层商用环境的成熟，我们还是要明白其高低取舍，不必为一些局部而感叹。

扯了一大堆，还是进入正题。

今天来评测MJ新模型的摄影方面。主要测了两个截面，一个是商业摄影，另一个是臆想型题材，也就是天马行空的想象。这两者是有矛盾之处的，以此来看大模型的性能可见其张容度。

（1）

一些食物类摄影效果很惊艳，昨天在某群中看到某君捞出一些很优质的食物摄影就心中一动，才有了这个评测摄影的心思。
食物摄影评测捞图如下：

（2）

然后是一组动物拟人肖像，这个也是模仿西班牙摄影师Yago Partal的作品思路，但没有把西班牙摄影师Yago Partal的名字直接写入prompt,只是描述拟人动物肖像。由此看到的效果确实很不错，但同时也确实看到新模型有类似过拟合（专业术语：指与模型参考的原稿过于相似而导致侵权嫌疑）问题。

以上是写实部分的实测，确实效果很强悍。

（3）

以下为臆想型题材的实测，明显就很难如上这般丝滑了，就如同戳到了新模型的痛处，效果磕磕巴巴的，看得出极为吃力。

一组还算比较写实的丧尸+时尚模特的图：就把它叫做《丧尸时尚》，效果还是不错的，保持了之前的优质感和丝滑感。

第二组试着生成漫威角色+时尚先生的感觉，但效果就比较一般了

（4）

最后是一些比较飞的想象，这就直接戳到MJ新模型的老腰疼了。

从半复活的兵马俑开始到兵马俑挺进威尼斯水城、到水淹自由女神像、到水淹长城、水淹外滩、到四川火锅里的自由女神等等。语义转成画面基本都做到了，这也是一再获得确认的结论：新模型增强语义理解这个部分，但细节成像品质和叙事精彩度就很人失望了。

水淹自由女神

水淹外滩

水淹长城

当自由女神遭遇四川火锅

如果前面的叙事还算合情合理的话，这一组就彻底翻车啦~

虽然画面有些辣眼睛，但又有种魔幻现实的黑色幽默感

总体而言，写实摄影方面的叙事性能挺强悍的，现实中足够丰富的题材出品很惊艳。而比较飞的想象力画面成品率较低，取决于是否在审美兼容度之内，超出自然成像太远的也能拼凑出来，但美不美就不能保障了。这样就需要有艺术家风格化的方式来弥补，加上艺术家风格化等描述，应该可以从另一个视角达成既符合语义内容又能兼顾人类美学。比如达利这样的超现实主义，zb大神那样的暗黑恐怖美学的渲染...这个部分的平衡永远创作空间中最有趣也最难以把握的地方了。

编辑于 2022-11-11 23:39

全部评论(0)

加入社群，参与互动 >

打开APP