什么？首个实现“时间因果”的视频生成模型！

点击上方蓝字关注洞见AI世界👆

免费获取DeepSeek资料库，AI浪潮里，我们互为灯塔

picture.image

4月23日，北京五道口传来重磅消息——由清华特奖得主曹越创立的Sand AI，正式开源全球首个高质量自回归视频生成模型MAGI-1 ！

在正式介绍如何使用前，先通过3个震撼案例感受MAGI-1的“时间魔法”——每一秒都可控，每一帧都连贯 ：

这个被海外网友惊呼“WTF”的中国模型，一出手就创下多个纪录：

• 物理真实性断层第一 ：在Physics-IQ基准测试中，MAGI-1的视频续写模式（V2V）以56%的分数，比谷歌VideoPoet高出近一倍，是Sora的5.6倍！
• 架构颠覆 ：首个实现“时间因果性”的视频模型，像拍电影一样逐秒生成，支持无限续写，彻底告别“动图式生成”。
• 硬核开源 ：从4.5B轻量版（单张4090可跑）到24B完整版，代码、模型、61页技术报告全公开，Hugging Face一键下载！

picture.image

手把手教你用MAGI-1生成视频！

为了让你彻底爱上 MAGI-1，我们来玩个实例，看看它怎么把创意变成现实。

picture.image

上传图片后输入提示词生成视频，具体步骤如图所示：

picture.image

MAGI-1 生成一段 5 秒视频，跑车还原度满分，但是这个气流波动效果稍微有丢丢夸张，但是整体效果还是不错的

MAGI-1不仅支持图片生成视频，也支持视频续写模式（V2V），我们再来验证测试一下

picture.image

步骤也是和图片生成视频的步骤是一致的，这次我测试了几次

picture.image

我发现在V2V中，如果你的提示词中出现了没有在视频中的人或物，效果就有点不那么令人满意

如果你的提示词只是对视频的续写，那效果还是很令人惊艳的，我会感觉到跑车的颜色与初始图片相比略微有点改变，但是无伤大雅

MAGI-1 对普通用户友好，无需编程，官网上传图/文即可生成，支持中文提示词（自动增强为详细描述）。

当其他模型还在“拼画质”时，MAGI-1早已开辟新赛道——让视频生成拥有“时间逻辑” 。它不仅是创作工具，更是“物理世界模拟器”：

正如曹越在技术报告中所说：“语言模型构建虚拟世界，视频模型还原现实规律。MAGI-1的目标，是成为连接虚拟与现实的‘时间桥梁’。”

从Swin Transformer到MAGI-1，曹越团队用扎实的技术证明：真正的创新，不是跟风跑分，而是开辟新赛道 。当全球还在为“如何让视频不卡顿”发愁时，他们已让AI懂得“先发生什么，后发生什么”。

这一次，中国开源又一次站在世界前沿。无论你是开发者、创作者，还是普通用户，MAGI-1都值得你亲自体验——因为它不仅是一个模型，更是一扇门，通往“可控、连贯、符合现实规律”的视频生成新时代。

现在，打开你的浏览器，让AI开始“拍电影”吧！