Mistral AI开源Codestral代码大模型：70+语言支持，更小更快，性能不输竞品！ - 文章 - 开发者社区

我们推出 Codestral，我们的第一个代码模型。Codestral 是一种开放权重生成式 AI 模型，专为代码生成任务而设计。它帮助开发人员通过共享指令和完成 API 端点编写代码并与之交互。可以用来为软件开发人员设计高级人工智能应用程序。

官方博客地址如下：


        
          
https://mistral.ai/news/codestral/

精通 80 多种编程语言的模型

Codestral 在 80 多种编程语言的多样化数据集上进行了训练，包括最流行的语言，例如 Python、Java、C、C++、JavaScript 和 Bash。它在 Swift 和 Fortran 等更具体的语言上也表现良好。这种广泛的语言基础确保 Codestral 可以在各种编码环境和项目中为开发人员提供帮助。

Codestral 节省了开发人员的时间和精力：它可以完成编码功能、编写测试以及使用中间填充机制完成任何部分代码。与 Codestral 交互将有助于提高开发人员的编码水平并降低出现错误和错误的风险。

设定代码生成性能的标准

作为 22B 模型，与之前用于编码的模型相比，Codestral 在代码生成的性能/延迟空间方面设立了新标准。

凭借 32k 的更大上下文窗口（与竞争对手的 4k、8k 或 16k 相比），Codestral 优于 RepoBench（一种用于代码生成的远程评估）中的所有其他模型。结果如下图： picture.image

我们将 Codestral 与具有更高硬件要求的现有代码特定模型进行比较。

Python。我们使用四个基准：HumanEval pass@1、MBPP sanitized pass@1 来评估 Codestral 的 Python 代码生成能力，CruxEval 来评估 Python 输出预测，以及 RepoBench EM 来评估 Codestral 的远程存储库级代码完成。
SQL。为了评估 Codestral 在 SQL 中的性能，我们使用了 Spider 基准测试。

此外，我们还评估了 Codestral 在除 Python 之外的六种不同语言（C++、bash、Java、PHP、Typescript 和 C#）中的多个 HumanEval pass@1 中的性能，并计算了这些评估的平均值。结果如下图： picture.image

权重下载地址：


        
          
https://huggingface.co/mistralai/Codestral-22B-v0.1