Mistral推出AI代码生成模型Codestral

Mistral AI 发布首个代码生成模型 Codestral

Mistral AI 发布了其首个专注于代码生成的 AI 模型——Codestral。该模型旨在帮助开发者更高效、准确地完成编码任务。

Codestral 的功能与特点

Codestral 能够处理多种编程任务，包括生成代码片段、完成函数、编写测试代码以及补全不完整的代码段。它支持超过 80 种编程语言，包括 Python、Java、C、C++、JavaScript 和 Bash 等。

上下文长度与性能

Codestral 的上下文长度为 32k，远超其他代码生成 AI 模型。这使得它能够生成更复杂的代码结构，并为复杂的编程问题提供更详细和完整的解决方案。在多项基准测试中，Codestral 表现优异，超越了 CodeLlama 70B、Deepseek Coder 33B 和 Llama 3 70B 等模型。例如，在 Python 代码生成的 HumanEval 测试中，Codestral 得分为 81.1%，在 Python 输出预测的 CruxEvall 测试中得分为 51.3%。

集成与易用性

Codestral 已集成到流行的开发环境如 VSCode 和 JetBrains 中，使开发者能够轻松使用。此外，它还支持与 LlamaIndex 和 LangChain 集成，方便用户构建代理应用程序。

用户反馈与测试结果

JetBrains 的研究员 Mikhail Evtikhiev 表示，Codestral 在他们的 Kotlin-HumanEval 基准测试中表现优异，超过了 GPT-4-Turbo 和 GPT-3.5-Turbo。用户 @1littlecoder 在 X 上分享称，Codestral 成功解决了一个来自 HackerRank 的 Bash 难题。

资源需求与使用限制

尽管 Codestral 功能强大，但它需要高性能计算资源，并且有一定的使用限制。Codestral 是一个 22B 的开源权重模型，采用 Mistral AI 非生产许可证（Mistral AI Non-Production License），这意味着它可以用于研究和测试目的。用户可以在 HuggingFace 上下载 Codestral。