点击上方 蓝字 关注洞见AI世界👆
免费获取DeepSeek资料库,AI浪潮里,我们互为灯塔
4月23日,北京五道口传来重磅消息——由清华特奖得主曹越创立的Sand AI,正式开源全球首个高质量自回归视频生成模型MAGI-1 !
在正式介绍如何使用前,先通过3个震撼案例感受MAGI-1的“时间魔法”——每一秒都可控,每一帧都连贯 :
✦ 案例 1:
✦ 案例 2:
✦ 案例 3:
这个被海外网友惊呼“WTF”的中国模型,一出手就创下多个纪录:
- • 物理真实性断层第一 :在Physics-IQ基准测试中,MAGI-1的视频续写模式(V2V)以56%的分数,比谷歌VideoPoet高出近一倍,是Sora的5.6倍!
- • 架构颠覆 :首个实现“时间因果性”的视频模型,像拍电影一样逐秒生成,支持无限续写,彻底告别“动图式生成”。
- • 硬核开源 :从4.5B轻量版(单张4090可跑)到24B完整版,代码、模型、61页技术报告全公开,Hugging Face一键下载!
手把手教你用MAGI-1生成视频!
为了让你彻底爱上 MAGI-1,我们来玩个实例,看看它怎么把创意变成现实。
第一步:注册&准备(5分钟搞定)
-
- 打开Sand AI官网(
sand.ai
),用邮箱注册,新手送500积分(可生成50秒视频)。
- 打开Sand AI官网(
-
- 准备一张图片,这里我选择了一辆蓝色跑车
第二步:生成第一段视频
上传图片后输入提示词生成视频,具体步骤如图所示:
MAGI-1 生成一段 5 秒视频,跑车还原度满分,但是这个气流波动效果稍微有丢丢夸张,但是整体效果还是不错的
第三步:视频续写
MAGI-1不仅支持图片生成视频,也支持视频续写模式(V2V),我们再来验证测试一下
步骤也是和图片生成视频的步骤是一致的,这次我测试了几次
我发现在V2V中,如果你的提示词中出现了没有在视频中的人或物,效果就有点不那么令人满意
如果你的提示词只是对视频的续写,那效果还是很令人惊艳的,我会感觉到跑车的颜色与初始图片相比略微有点改变,但是无伤大雅
MAGI-1 对普通用户友好,无需编程,官网上传图/文即可生成,支持中文提示词(自动增强为详细描述)。
当其他模型还在“拼画质”时,MAGI-1早已开辟新赛道——让视频生成拥有“时间逻辑” 。它不仅是创作工具,更是“物理世界模拟器”:
- • 影视行业 :分镜脚本自动生成,复杂动作连贯演绎,降低80%动画制作成本;
- • 教育领域 :物理实验模拟、历史场景还原,让知识“动”起来;
- • 游戏开发 :实时生成NPC连贯动作,打造更真实的开放世界。
正如曹越在技术报告中所说:“语言模型构建虚拟世界,视频模型还原现实规律。MAGI-1的目标,是成为连接虚拟与现实的‘时间桥梁’。”
结语:中国AI开源,正在改写世界规则
从Swin Transformer到MAGI-1,曹越团队用扎实的技术证明:真正的创新,不是跟风跑分,而是开辟新赛道 。当全球还在为“如何让视频不卡顿”发愁时,他们已让AI懂得“先发生什么,后发生什么”。
这一次,中国开源又一次站在世界前沿。无论你是开发者、创作者,还是普通用户,MAGI-1都值得你亲自体验——因为它不仅是一个模型,更是一扇门,通往“可控、连贯、符合现实规律”的视频生成新时代。
现在,打开你的浏览器,让AI开始“拍电影”吧!