当红开源Devstral 2系列模型登陆Ollama

大模型机器学习GPU

Mistral AI的Devstral 2系列模型现在可以通过Ollama运行。该系列包含两个版本:24B参数的Devstral Small 2和123B参数的Devstral 2。

picture.image

根据SWE-Bench验证结果,Devstral 2系列在开源权重模型中表现突出。Devstral Small 2得分为68.0,Devstral 2达到72.2。作为对比,DeepSeek V3.2得分为73.1,而闭源模型如GPT 5.1 Codex Max为77.9。

picture.image

参数效率方面,24B的Devstral Small 2在SWE-Bench上的性能接近75%,明显优于其他同规模模型。这表明模型性能不仅取决于参数数量,架构优化同样关键。

picture.image

在人类评估的代码生成任务中,Devstral 2与DeepSeek V3.2对比胜率为46%,与Claude 4.5 Sonnet对比胜率达到41%。

picture.image

Ollama同时提供了云端版本 devstral-2:123b-cloud,适合需要远程访问的开发场景。有用户指出,云版本将显著提升远程工作流程的效率。

模型详情页面:

关注公众号回复“进群”入群讨论。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
在火山引擎云搜索服务上构建混合搜索的设计与实现
本次演讲将重点介绍字节跳动在混合搜索领域的探索,并探讨如何在多模态数据场景下进行海量数据搜索。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论