六小虎之阶跃星辰,加入开源阵营,开源SOTA文生视频!

刚刚,阶跃星辰开源 Step-Video-T2V。 一个30B参数的,文生视频模型。可生产最多204帧的视频,大概8s的样子。

picture.image

提出了一种用于视频的深度压缩 VAE,实现了 16x16 的空间压缩比和 8x 的时间压缩比。在最终阶段应用直接偏好优化(DPO),以进一步提高生成视频的视觉质量。S

picture.image

似乎用到了hunyuan-clippicture.image

效果演示

0
0
0
0
评论
未登录
暂无评论