Qwen在2025年最后一天发布了Qwen-Image-2512,这是其文生图模型的12月升级版。该模型在AI Arena的万次盲测中被评为最强的开源图像模型,与闭源系统竞争也不落下风。
模型主要改进集中在三个方面:人物生成更真实,大幅减少了"AI感",面部细节更丰富;自然纹理更细腻,风景、水、毛发等元素的质感更锐利;文本渲染能力更强,在图文组合中的布局和准确性都有提升。
技术社区对模型的快速迭代表示惊讶。有网友提到,使用Unsloth的Dynamic GGUF格式,只需14GB内存就能在本地运行。这对硬件配置有限的开发者是个好消息。
实际测试中,模型生成速度确实令人印象深刻。与Grok imagine等采用AR技术的模型相比,Qwen-Image-2512在保持质量的同时,生成速度更快。
硬件要求方面,有用户询问8GB显存加32GB DDR4内存是否能运行。虽然官方推荐14GB RAM+VRAM配置,但通过优化应该能在更低配置上运行。
模型现已上线多个平台,包括Qwen Chat、Hugging Face、ModelScope等。开发者可以立即体验这个"新年礼物"。
从展示的样张看,无论是食物特写、自然景观还是复杂场景,Qwen-Image-2512都表现出色。特别是在文本与图像的结合上,准确度明显提升。
对于内容审核问题,目前官方尚未明确说明。但从开源社区的一贯做法看,应该会保持相对开放的态度。
模型相关资源:
