Mistral AI的Devstral 2系列模型现在可以通过Ollama运行。该系列包含两个版本:24B参数的Devstral Small 2和123B参数的Devstral 2。
根据SWE-Bench验证结果,Devstral 2系列在开源权重模型中表现突出。Devstral Small 2得分为68.0,Devstral 2达到72.2。作为对比,DeepSeek V3.2得分为73.1,而闭源模型如GPT 5.1 Codex Max为77.9。
参数效率方面,24B的Devstral Small 2在SWE-Bench上的性能接近75%,明显优于其他同规模模型。这表明模型性能不仅取决于参数数量,架构优化同样关键。
在人类评估的代码生成任务中,Devstral 2与DeepSeek V3.2对比胜率为46%,与Claude 4.5 Sonnet对比胜率达到41%。
Ollama同时提供了云端版本 devstral-2:123b-cloud,适合需要远程访问的开发场景。有用户指出,云版本将显著提升远程工作流程的效率。
模型详情页面:
- Devstral Small 2: https://ollama.com/library/devstral-small-2
- Devstral 2: https://ollama.com/library/devstral-2
关注公众号回复“进群”入群讨论。
