Claude 3.7 Sonnet 携“扩展思维”亮相，致力于解决复杂问题

Anthropic 发布 Claude 3.7 Sonnet 及 Claude Code

Anthropic 于周一发布了新一代 AI 语言模型 Claude 3.7 Sonnet，并推出了面向开发者的命令行 AI 工具 Claude Code。Claude 3.7 Sonnet 引入了名为“扩展思维”（Extended Thinking）的模拟推理能力，允许模型逐步解决问题。此外，Claude Code 目前处于有限研究预览阶段。

Claude 3.7 Sonnet 的主要特点

扩展思维功能：用户可以选择快速响应或逐步推理的链式思维处理模式，类似于 OpenAI 的 o1 和 o3 系列、Google 的 Gemini 2.0 Flash Thinking 以及 DeepSeek 的 R1 模型。
API 控制：开发者可以通过 API 指定模型用于思考的 token 数量，最大输出限制为 128,000 token。
定价与可用性：Claude 3.7 Sonnet 在所有订阅计划中提供，扩展思维功能在除免费版外的所有计划中可用。API 定价保持不变，输入 token 每百万 3 美元，输出 token 每百万 15 美元，思考 token 包含在输出定价中。
性能提升：与 Claude 3.5 Sonnet 相比，Claude 3.7 Sonnet 减少了 45% 的不必要拒绝，使其更倾向于执行用户指令，而非因伦理问题拒绝。
编码能力：在 SWE-bench Verified 和 TAU-bench 等测试中，Claude 3.7 Sonnet 表现出色，尤其在编程任务中表现优异。

Claude Code 的功能

自主编码助手：Claude Code 可直接在终端操作，支持搜索代码库、读写文件、编写和运行测试、提交代码到 GitHub 等任务。
调试与重构：Anthropic 称 Claude Code 在内部测试中能完成通常需要 45 分钟以上的手动任务。
研究预览：目前仅作为有限研究预览提供，Anthropic 计划根据用户反馈逐步改进。

其他重要信息

GitHub 集成：Anthropic 已将 GitHub 集成扩展到所有 Claude 计划，开发者可直接连接代码库进行修复、开发和文档工作。
命名问题：Claude 3.5 Sonnet 在 2024 年 10 月更新后，部分用户因命名混淆而将其称为“Claude 3.6 Sonnet”。Anthropic 在 Claude 3.7 发布页面中表示“命名教训已吸取”。
扩展推理测试：Claude 3.7 Sonnet 在扩展思维模式下表现出色，能够逐步解决问题，并在测试中给出明确的答案和解释。

未来展望

Anthropic 目前未宣布超出“Claude Pro”（20 美元/月）的订阅计划，但开发者可能需要类似 OpenAI ChatGPT Pro（200 美元/月）的更高级别计划以满足扩展使用需求。Claude 3.7 Sonnet 已通过 Claude 网站、Claude 应用、Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 提供。

总体而言，Claude 3.7 Sonnet 和 Claude Code 的发布标志着 Anthropic 在 AI 推理和开发工具领域的进一步创新。