Anthropic 发布 Claude 3.7 Sonnet 及 Claude Code
Anthropic 于周一发布了新一代 AI 语言模型 Claude 3.7 Sonnet,并推出了面向开发者的命令行 AI 工具 Claude Code。Claude 3.7 Sonnet 引入了名为“扩展思维”(Extended Thinking)的模拟推理能力,允许模型逐步解决问题。此外,Claude Code 目前处于有限研究预览阶段。
Claude 3.7 Sonnet 的主要特点
- 扩展思维功能:用户可以选择快速响应或逐步推理的链式思维处理模式,类似于 OpenAI 的 o1 和 o3 系列、Google 的 Gemini 2.0 Flash Thinking 以及 DeepSeek 的 R1 模型。
- API 控制:开发者可以通过 API 指定模型用于思考的 token 数量,最大输出限制为 128,000 token。
- 定价与可用性:Claude 3.7 Sonnet 在所有订阅计划中提供,扩展思维功能在除免费版外的所有计划中可用。API 定价保持不变,输入 token 每百万 3 美元,输出 token 每百万 15 美元,思考 token 包含在输出定价中。
- 性能提升:与 Claude 3.5 Sonnet 相比,Claude 3.7 Sonnet 减少了 45% 的不必要拒绝,使其更倾向于执行用户指令,而非因伦理问题拒绝。
- 编码能力:在 SWE-bench Verified 和 TAU-bench 等测试中,Claude 3.7 Sonnet 表现出色,尤其在编程任务中表现优异。
Claude Code 的功能
- 自主编码助手:Claude Code 可直接在终端操作,支持搜索代码库、读写文件、编写和运行测试、提交代码到 GitHub 等任务。
- 调试与重构:Anthropic 称 Claude Code 在内部测试中能完成通常需要 45 分钟以上的手动任务。
- 研究预览:目前仅作为有限研究预览提供,Anthropic 计划根据用户反馈逐步改进。
其他重要信息
- GitHub 集成:Anthropic 已将 GitHub 集成扩展到所有 Claude 计划,开发者可直接连接代码库进行修复、开发和文档工作。
- 命名问题:Claude 3.5 Sonnet 在 2024 年 10 月更新后,部分用户因命名混淆而将其称为“Claude 3.6 Sonnet”。Anthropic 在 Claude 3.7 发布页面中表示“命名教训已吸取”。
- 扩展推理测试:Claude 3.7 Sonnet 在扩展思维模式下表现出色,能够逐步解决问题,并在测试中给出明确的答案和解释。
未来展望
Anthropic 目前未宣布超出“Claude Pro”(20 美元/月)的订阅计划,但开发者可能需要类似 OpenAI ChatGPT Pro(200 美元/月)的更高级别计划以满足扩展使用需求。Claude 3.7 Sonnet 已通过 Claude 网站、Claude 应用、Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 提供。
总体而言,Claude 3.7 Sonnet 和 Claude Code 的发布标志着 Anthropic 在 AI 推理和开发工具领域的进一步创新。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。