智谱GLM4、MiniMax-MoE全新发布 - 文章 - 开发者社区

昨天聊完：Open LLM榜单：MoE、DPO；今天就有一个商业MoE大模型发布了。

MiniMax-MoE

发布大语言模型 abab6，为国内首个 MoE 大语言模型。在 MoE 结构下，abab6 拥有大参数带来的处理复杂任务的能力，同时模型在单位时间内能够训练足够多的数据，计算效率也可以得到大幅提升。改进了 abab5.5 在处理更复杂、对模型输出有更精细要求场景中出现的问题。

1、MOE架构：效果与效率

在该结构下，模型参数被划分为多组“专家”，每次推理时只有一部分专家参与计算。基于 MoE 结构，abab6 可以具备大参数带来的处理复杂任务的能力；计算效率也会得到提升，模型在单位时间内能够训练足够多的数据。

2、 abab6测评结果：在复杂场景下表现更好

IFEval：这个评测主要测试模型遵守用户指令的能力。

MT-Bench：这个评测衡量模型的英文综合能力。包括角色扮演、写作、信息提取、推理、数学、代码、知识问答。

AlignBench：该评测反映了模型的中文综合能力测试，测试形式与 MT-Bench 类似。

结论：

abab6 在三个测试集中 均明显好于 我们前一代模型 abab5.5。在指令遵从、中文综合能力和英文综合能力上，abab6 大幅超过了 GPT-3.5。和 Claude 2.1 相比，abab6 也在指令遵从、中文综合能力和英文综合能力上 略胜一筹 。相较于 Mistral 的商用版本 Mistral-Medium，abab6 在指令遵从和中文综合能力上 都优于 Mistral-Medium，在英文综合能力上与 Mistral- Medium 旗鼓相当。

picture.image