DeepSeek-V3发布：编程能力超过 Claude Sonnet 3.5！ - 文章 - 开发者社区

备受期待的Deepseek V3终于开源!这款全新的AI模型在多语言编程能力上取得了重大突破，其在aider多语言编程测评中的表现，甚至超越了Claude3.5 Sonnet V2等竞争对手，引发了业界广泛关注。

据了解，Deepseek V3相比之前的版本，在性能上实现了质的飞跃。Deepseek V2.5在aider测评中的成功率仅为17%，而V3则暴增至48%，这充分展现了其强大的进步。

编程能力暴增

DeepSeek V3 预览版低调发布，但是非常牛逼。一句话重点：编程能力超过 Claude Sonnet 3.5 ,这还只是预览版。

测试的基准是 Aider 的多语言基准，一个用于衡量模型编程能力的基准

几个模型的得分

Aider Polyglot 排行榜，预览得分48.4%，排名第二，仅次于 o1-2024-12-17 (high)，领先于 Claude 3.5 Sonnet-20241022 和 Gemini Exp-1206。在 BigCodeBench-Hard 上排名第一 。

picture.image

LiveBench排行榜中，DeepSeek v3 是最佳开源LLM 和继“gemini-exp-1206”之后第二佳非推理LLM🔥

picture.image

Deepseek V3采用了高达6850亿参数的 混合专家（MoE） 架构。该架构包含256个专家，并使用sigmoid路由方式，每次选取前8个专家(topk=8)参与计算，这种设计使得模型能够更加高效地处理复杂任务，并提高了性能。

picture.image

picture.image

添加微信，回复”大模型“进入交流群

picture.image