我用了以下五段提示词,测试了最新模型Midjourney V7.0的生图效果

大模型向量数据库云存储

最近的AI圈不可谓不热闹,继上个月谷歌推出Gemini2.0之后,Open AI也推出了更加强大、效果更加惊艳的GPT 4o,这一波直接磨灭了众多设计师引以为傲的技术应用和流程操作门槛。

与此同时,国内的AI也不甘落后,即梦在前几天也推出了全新的即梦3.0,其近乎逆天的中文直出能力,也让其在AI圈里火了一把。

picture.image

而作为曾经AI绘画界的老大哥——Midjourney(MJ),自从今年2月爆出其要推出最新模型后,几经周折,终于在前两天,MJ终于更新了他们憋了几个月的大招:Midjourney V7.0

picture.image

这次更新不同以往“挤牙膏”式的小打小闹,官方表示新的模型在图像质量、纹理、物体连贯性等方面都有了显著的提升。

picture.image

而除了对本次更新后模型出图质量的夸奖外,最令人期待的,当属在接下来的两个月里,每两周甚至是每周都会推出新的功能,这就有点逆天了。其中我最期待的,同样也是官方宣称的最强大的功能,就是关于角色和对象的引用。

picture.image

官网: https://www.midjourney.com/updates

现在,我们先忘掉官方说的那些天花乱坠的功能和更新,模型本身的图像能力才是这一切的基底。就在昨晚,我用了五组非常简单的提示词,随机用MJ7.0和MJ6.1跑了几次图,然后进行了对比(左边两列是V7.0,右边两列是V6.0),让我们一起来看看7.0的表现如何:

第一组提示词: The face of a 60-year-old woman

译文: 一个60岁女人的面部写真

picture.image

从这一组人物面部特写来看,结合我平时对于V6.1的使用体验(V6.1所出的人物面部皮肤纹理在放大的情况下有时候会呈现很明显的塑料感),V7在面部纹理的处理上似乎更加自然了。

第二组提示词: A close-up of a cuddly stuffed animal that sits on a desk

译文: 一个可爱的毛绒玩具的特写镜头,这个玩具被放在书桌上

picture.image

这组提示词我并没有指定玩具形象,但V7给出的画面呈现显然更加丰富一些。

第三组提示词: It shows a close-up shot of a couple's hands clasped together

译文: 画面中是一对情侣的两只手紧握在一起的特写镜头

picture.image

这一组的话.....算了还是没法看,大家还是上Flux吧

第四组提示词: A large aerial shot of a lush valley and spectacular waterfalls

译文: 一个航拍大场景,画面中是遍布绿植的山谷和壮观的瀑布

picture.image

总体的画面表现看起来差不多,但V6.1对于提示词中“瀑布”这一元素的提取显然要优于V7,在这我投V6.1一票。

第五组提示词: The image is a rendering of a modern, minimalist living room

译文: 画面是一间现代极简风格的起居室效果图

picture.image

从这一组室内效果图来看,V7和V6.1似乎在构图方面存在不同,但V7所处的图像总体感觉元素很杂,而V6.1更能符合提示词中“现代极简”的要求。

当然,因选择范围和抽卡数量,以及在使用V7前系统测试的一套个性化图像风格(在使用V7前系统会有一套评图测试,以便系统根据你的审美进行相应调整)等原因,上述的出图结果并不能直接作为我们评判两代模型的的差别依据,但就我整体用下来的感觉,就是普通人对于这种可能的细微美学差距的感知是几乎为0的,所以其实区别并不算大。

所以,大家对此次MJ推出的V7有何体验或看法呢?欢迎讨论

最后,如果你喜欢我的文章,欢迎点赞、转发和关注;如果我的文章能为你提供哪怕一点价值,那将是我的万分荣幸,在此感谢每一位读者🙏

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论