Claude 3.7 Sonnet & Claude Code 今日发布

Claude 3.7 Sonnet & Claude Code 今日发布
直讲重点
1. One model, two ways to think,一种模型,两种思考方式。
Claude 3.7 是首个结合一般大语言模型和推理模型功能的混合推理模型。标准模式提供快速响应,扩展思考模式实现逐步推理。
正如人类使用同一大脑既能快速反应又能深入思考,Anthropic 认为推理能力应是前沿模型的内在特质,而非完全独立于外的单独模型。
Claude 3.7 Sonnet & Claude Code 今日发布
2. 通过 API 访问可以控制模型思考时长。
当下一些推理的模型思考过程是过度的。考虑到不同场景下速度、成本和精确度的不同需求,开发者可以设置一个“thinking budget”,来控制模型思考的上限。
An illustration of Claude thinking step-by-step
3. 在编码、Tool Use 领域一如既往的优秀。
多方位性能超过 OpenAI o3-mini、DeepSeek R1 和 Grok 3 Beta。
Claude 3.7 可以说是当下最适合做写代码,以及做 Agent 的模型。
Benchmark table comparing frontier reasoning models
4. An Agentic Coding Tool — Claude Code
估计是看到 Cursor、Winsurf 都赚大钱了,也想探索下这方面的商业化。
具体演示如下:
5. 3.7 已经全量上线可以体验了,如果你的 Claude 付费账户没有被封禁的话。
不过 Cursor、Monica 等应该也会马上接入。
下面是一个基于 extended thinking mode 向用户解释三门问题的示例。
6. 发展规划
2025 的对应了 OpenAI 所说的 L3 智能体(不仅可以思考,还能采取行动的 AI 系统),2027 的相当于 L5 组织者(可以完成组织工作的 AI)。
Milestone timeline showing Claude progressing from assistant to pioneer
图片
图片

原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/43388.html

Like (0)
Previous 2025-02-25 00:10
Next 2025-02-25 18:10

相关推荐