12月开源模型汇总，2026你最期待哪个模型更新？

大模型机器学习GPU

大家好，我是刘聪NLP。

又到了一个月的最后一天，12月，一开始DeepSeek就更新了一个小版本，但并没那么惊艳，

最卷的应该是是智谱了，来了一个开源周，1月8号也要IPO了，

惊喜的是，小米正式加入大模型队伍了，

当然MiniMax（1月9号IPO）、美团、阶跃、Qwen、通义、腾讯也都是持续开源，

因为豆包手机，所以端侧GUI模型是本月让我最玩上头的模型了。

然后，HuggingFace也出了一个2025年中国开源模型热力图，

Qwen当之无愧第一，382个模型，其他的感兴趣的可以自己去看一下。

picture.image

https://huggingface.co/spaces/zh-ai-community/model-release-heatmap-zh

PS：往期回顾，7月开源模型汇总、8月开源模型汇总、9月开源模型汇总、10月开源模型汇总、11月开源模型汇总

2025年最后一天了，文末会有惊喜，随缘了~

12月汇总的开源模型如下，

12月1日，阶跃开源GELab-Zero-4B模型开源（其实是11月30日，但我12月1日才看到），在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录，取得SOTA成绩，详细内容。

picture.image

12月1日，DeepSeek正式发布DeepSeek-V3.2和DeepSeek-V3.2-Speciale两款模型。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版，同时结合了 DeepSeek-Math-V2 的定理证明能力。

picture.image

12月3日，MistralAI开源系列模型，Mistral-Large-3，总参数为675B，41B 激活参数，MoE 架构，对标DeepSeek-V3.1、K2。三个小模型Ministral-3，分别是3B，8B，14B，Dense模型，有 pretraining、instruct、reasoning 三个版本，对标Qwen3-VL。

PS：为了纪念这个欧洲战神，放一波没毛病~

picture.image

12月5日，美团LongCat开源图像生成模型，一共是3个模型，LongCat‑Image、LongCat‑Image‑Dev、LongCat‑Image‑Edit，详细细节。

picture.image

12月5日，腾讯开源480p I2V 分步蒸馏模型，单张 RTX 4090 显卡可在 75 秒内完成视频生成。

picture.image

12月8日，智谱开源GLM-4.6V多模态模型，两个版本模型，106B和9B，106B模型架构为MoE架构，激活参数12B；9B模型为Dense模型，一手评测！

picture.image

12月8号，鹏城实验室联合清华开源 PCMind-2.1-Kaiyuan-2B模型，在国产Ascend 910A 集群上训练的端侧模型。

picture.image

12月9日，智谱开源AutoGLM-Phone-9B模型，GUI模型，以多模态方式理解手机屏幕内容，并通过自动化操作帮助用户完成任务，详细实测。

picture.image

12月10日，智谱开源GLM-ASR-Nano-2512模型，一个1.5B参数的端侧语音识别模型，在当前开源语音识别方向的SOTA。

picture.image

12月10日，阿里通义实验室开源Wan-Move视频模型，通过运动轨迹控制视频生成。

picture.image

12月11日，智谱开源GLM-TTS模型，支持零样本语音克隆和流式推理。

picture.image

12月13日，ByteDance开源Dolphin-v2文档解析模型，基于Qwen2.5-VL-3B增量训练。

picture.image

12月12日，阿里开源Fun-CosyVoice3-0.5B-2512模型，0.5B的语音合成模型。

picture.image

12月12日，阿里通义实验室开源Fun-ASR-Nano-2512语音识别模型，支持识别 31 种语言。

picture.image

12月16日，小米开源MiMo-V2-Flash模型，MoE架构，总参数309B，激活参数15B，48层，专家数256，激活8个专家，没有共享专家，详细内容。

picture.image

12月16日，美团LongCat开源LongCat-Video-Avatar数字人模型，能生成超逼真、口型同步的长视频，保持人物身份一致性和自然动态。

picture.image

12月17日，腾讯开源HY-World 1.5世界模型，是一个流式视频扩散模型，能够实现具有长期几何一致性的实时交互式世界建模，解决了当前方法速度和内存之间的权衡。

picture.image

12月18日，Qwen开源Qwen-Image-Layered图像分层编辑模型，能够将图像分解为多个 RGBA 图层的模型。

picture.image

12月22日，智谱开源GLM-4.7模型，代码、前端、工具调用能力大幅提升。

picture.image

12月23日，MiniMax开源M2.1模型，围绕Code&Agent能力进行升级。

picture.image

12月23日，通义千问开源Qwen-Image-Edit-2511模型，是Qwen-Image-Edit-2509的增强版本，具有多项改进，包括更好的一致性。

picture.image

12月23日，阿里通义开源Fun-Audio-Chat-8B模型，是一款端到端语音交互模型。

picture.image

12月24日，阶跃开源NextStep-1.1图像生成模型，15B参数

picture.image

12月29日，通义实验室开源GUI模型-MAI-UI，暂时是2B和8B尺寸，后面计划开源，同时在办公、生活、出行、购物等高频场景中展现出实用的任务自动化能力。

picture.image

12月29日，腾讯开源扩散语言模型-WeDLM-8B-Instruct，扩散语言模型通过每步恢复多个掩码词元来实现并行解码，对比同等级的Qwen3-8B快3-6倍。

picture.image

12月30日，腾讯混元开源HY-MT1.5翻译模型，共1.8B和7B两个尺寸，支持33个语种互译以及5种民汉/方言，也包含捷克语、马拉地语、冰岛语等小语种。

picture.image

12月30日，腾讯混元开源HY-Motion-1.0，一个3D人体动作生成模型，根据简单的文本提示生成基于骨骼的 3D 角色动画，并可直接集成到各种 3D 动画流程中。

picture.image

最后，时间匆忙，也许有遗漏的国内开源大模型，欢迎评论区补充！

明天就是2026了，你最期待的哪个模型更新呢，也欢迎评论区留言。

PS：都看到这里，来个点赞、在看、关注吧。您的支持是我坚持的最大动力！

0

0

0

0

关于作者

关于作者

文章

0

获赞

0

收藏

0

评论

未登录

暂无评论