可灵AI全系列模型进入2.0，但我关心的仍然是这个

大模型视频服务图像处理

就在今天，AI视频领域又迎来了重大更新！

picture.image

没错，这次的重大更新来源于在国内，甚至是在国际上都备受好评的可灵AI。

可灵2.0，它终于来了，而且是文生图、文生视频以及图生视频的全系列更新，宣布可灵AI全系列跨入2.0时代！

picture.image

在这一次的可灵2.0发布会上，发言人称本次2.0版本的更新在以下三个方面取得了重大突破：

1.更好的语义遵循

2.更好的动态质量

3.更真实，更美

甚至直接宣称这一次的可灵2.0，是你能用到的这个世界上最强大的视觉生成模型！

而我在看到可灵平台上开放体验2.0后，也是立马向可图2.0扔出了我的“灵魂五问”：



一个60岁女人的面部写真


一个可爱的毛绒玩具的特写镜头，这个玩具被放在书桌上


一个航拍大场景，画面中是遍布绿植的山谷和壮观的瀑布


画面中是一对情侣的两只手紧握在一起的特写镜头


画面是一间现代极简风格的起居室效果图

我们来看看图像效果如何：

Prompt：一个60岁女人的面部写真

picture.image

Prompt：一个可爱的毛绒玩具的特写镜头，这个玩具被放在书桌上

picture.image

Prompt：一个航拍大场景，画面中是遍布绿植的山谷和壮观的瀑布

picture.image

Prompt：画面中是一对情侣的两只手紧握在一起的特写镜头

picture.image

Prompt：画面是一间现代极简风格的起居室效果图

picture.image

其实这五组图像看下来，最让我惊艳的还是对手部的控制。从可图2.0给我的这四张图来看，手部结构性问题几乎是完全正确的。

但我不信，所以我又跑了好几组：

picture.image

可以看到虽然还是有小部分图片中的手部出现了错误，但其实总体试下来，手部的正确率还是很高的，甚至是可以匹敌Flux的存在了。

难怪敢在发布会上称可图2.0已经超越了现阶段主流的一些文生图大模型

picture.image

但话说回来，我认为模型的迭代更新从而带来的技术及体验的进步是这个时代每个人都已意识到的事情，我们一边惊叹于新技术带来的更好的体验，但同时也一边平静的认为：哦，这本来就是可以预见的东西。

而抛开对于这些技术层面的关注，或许作为普通人的绝大多数，更在意的是使用门槛的问题。

毫无疑问，如今的AI一直在朝着“白痴”化操作的方向发展，而使用AI视频的操作门槛目前来看已经很傻瓜式了。

那再抛开技术门槛，大家更关注的又是什么呢？显而易见的，昂贵的价钱门槛。

可灵的效果好吗？当然好，现在如果谁跟你说可灵AI的效果一般，那他绝对不是这个行业的人；但可灵贵吗？确实也是真的贵！

我其实一直以来都不太喜欢类似可灵AI的这种“灵感值”制度，我想原因有下面几点：

第一，每次使用都是小心翼翼，生怕跑出来的效果不佳从而浪费了宝贵的“灵感值”。

而在可灵中10块钱才能换100个灵感数值，那这100个灵感值大概能干什么呢，以最新的可灵2.0文生视频为例，我没有其他任何复杂的操作，仅仅只是输入一句Prompt，但...100个灵感值没了...

picture.image

第二，即便你是会员，依旧支撑不起你正常的创作。

现在很多平台会将最新的模型、功能等设置会仅会员可用，这个其实是无可厚非的。但是在AI视频领域，单单只是一个月的会员价格，就可以劝退很多人了，更何况这个会员并无法提供给你无限的生成权限。

picture.image 没错，即便你是黄金会员，一个月也就给你那么些灵感值，如果你有一定的创作需求，这点灵感值是完全不够用的，所以你还是得老老实实去买。

当然这种制度性的问题归根到底还是基于现在算力成本昂贵的问题，但能否找到另一种方式，能够平衡好成本与用户的问题，或许是这个时代AI视频模型厂商所需要思考的

最后，如果你喜欢我的文章，欢迎点赞、转发和关注；如果我的文章能为你提供哪怕一点价值，那将是我的万分荣幸，在此感谢每一位读者🙏

推荐阅读

这两天，我搞了个毛线AI，将整个世界包裹在可爱的编织画面中（文末附原创模型链接）

狂肝了十天GPT 4o，我发现了几点不足

DeepSeek疯狂刁难完即梦3.0后，喊话说：快把GPT-4o给扔了吧！

我用了以下五段提示词，测试了最新模型Midjourney V7.0的生图效果

请看！我用即梦3.0与DeepSeek结合，来反映当今AI社会的乱象

0

0

0

0

关于作者

关于作者

文章

0

获赞

0

收藏

0

评论

未登录

暂无评论