大家好,我是刘聪NLP。
又到了一个月的最后一天,12月,一开始DeepSeek就更新了一个小版本,但并没那么惊艳,
最卷的应该是是智谱了,来了一个开源周,1月8号也要IPO了,
惊喜的是,小米正式加入大模型队伍了,
当然MiniMax(1月9号IPO)、美团、阶跃、Qwen、通义、腾讯也都是持续开源,
因为豆包手机,所以端侧GUI模型是本月让我最玩上头的模型了。
然后,HuggingFace也出了一个2025年中国开源模型热力图,
Qwen当之无愧第一,382个模型,其他的感兴趣的可以自己去看一下。
https://huggingface.co/spaces/zh-ai-community/model-release-heatmap-zh
PS:往期回顾,7月开源模型汇总、8月开源模型汇总、9月开源模型汇总、10月开源模型汇总、11月开源模型汇总
2025年最后一天了,文末会有惊喜,随缘了~
12月汇总的开源模型如下,
12月1日,阶跃开源GELab-Zero-4B模型开源(其实是11月30日,但我12月1日才看到),在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录,取得SOTA成绩,详细内容。
12月1日,DeepSeek正式发布DeepSeek-V3.2和DeepSeek-V3.2-Speciale两款模型。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。
12月3日,MistralAI开源系列模型,Mistral-Large-3,总参数为675B,41B 激活参数,MoE 架构,对标DeepSeek-V3.1、K2。三个小模型Ministral-3,分别是3B,8B,14B,Dense模型,有 pretraining、instruct、reasoning 三个版本,对标Qwen3-VL。
PS:为了纪念这个欧洲战神,放一波没毛病~
12月5日,美团LongCat开源图像生成模型,一共是3个模型,LongCat‑Image、LongCat‑Image‑Dev、LongCat‑Image‑Edit,详细细节。
12月5日,腾讯开源480p I2V 分步蒸馏模型,单张 RTX 4090 显卡可在 75 秒内完成视频生成。
12月8日,智谱开源GLM-4.6V多模态模型,两个版本模型,106B和9B,106B模型架构为MoE架构,激活参数12B;9B模型为Dense模型,一手评测!
12月8号,鹏城实验室联合清华 开源 PCMind-2.1-Kaiyuan-2B模型,在国产Ascend 910A 集群上训练的端侧模型。
12月9日,智谱开源AutoGLM-Phone-9B模型,GUI模型,以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务,详细实测。
12月10日,智谱开源GLM-ASR-Nano-2512模型,一个1.5B参数的端侧语音识别模型,在当前开源语音识别方向的SOTA。
12月10日,阿里通义实验室开源Wan-Move视频模型,通过运动轨迹控制视频生成。
12月11日,智谱开源GLM-TTS模型,支持零样本语音克隆和流式推理。
12月13日,ByteDance开源Dolphin-v2文档解析模型,基于Qwen2.5-VL-3B增量训练。
12月12日,阿里开源Fun-CosyVoice3-0.5B-2512模型,0.5B的语音合成模型。
12月12日,阿里通义实验室开源Fun-ASR-Nano-2512语音识别模型,支持识别 31 种语言。
12月16日,小米开源MiMo-V2-Flash模型,MoE架构,总参数309B,激活参数15B,48层,专家数256,激活8个专家,没有共享专家,详细内容。
12月16日,美团LongCat开源LongCat-Video-Avatar数字人模型,能生成超逼真、口型同步的长视频,保持人物身份一致性和自然动态。
12月17日,腾讯开源HY-World 1.5世界模型,是一个流式视频扩散模型,能够实现具有长期几何一致性的实时交互式世界建模,解决了当前方法速度和内存之间的权衡。
12月18日,Qwen开源Qwen-Image-Layered图像分层编辑模型,能够将图像分解为多个 RGBA 图层的模型。
12月22日,智谱开源GLM-4.7模型,代码、前端、工具调用能力大幅提升。
12月23日,MiniMax开源M2.1模型,围绕Code&Agent能力进行升级。
12月23日,通义千问开源Qwen-Image-Edit-2511模型,是Qwen-Image-Edit-2509的增强版本,具有多项改进,包括更好的一致性。
12月23日,阿里通义开源Fun-Audio-Chat-8B模型,是一款端到端语音交互模型。
12月24日,阶跃开源NextStep-1.1图像生成模型,15B参数
12月29日,通义实验室开源GUI模型-MAI-UI,暂时是2B和8B尺寸,后面计划开源,同时在办公、生活、出行、购物等高频场景中展现出实用的任务自动化能力。
12月29日,腾讯开源扩散语言模型-WeDLM-8B-Instruct,扩散语言模型通过每步恢复多个掩码词元来实现并行解码,对比同等级的Qwen3-8B快3-6倍。
12月30日,腾讯混元开源HY-MT1.5翻译模型,共1.8B和7B两个尺寸,支持33个语种互译以及5种民汉/方言,也包含捷克语、马拉地语、冰岛语等小语种。
12月30日,腾讯混元开源HY-Motion-1.0,一个3D人体动作生成模型,根据简单的文本提示生成基于骨骼的 3D 角色动画,并可直接集成到各种 3D 动画流程中。
最后,时间匆忙,也许有遗漏的国内开源大模型,欢迎评论区补充!
明天就是2026了,你最期待的哪个模型更新呢,也欢迎评论区留言。
PS:都看到这里,来个点赞 、在看 、关注 吧。 您的支持是我坚持的最大动力!
