大数跨境
0
0

Claude 3.7 Sonnet 深夜上线:混合思考+可控时间思考+编程工具,全球曾最成功的编码模型被替换了

Claude 3.7 Sonnet 深夜上线:混合思考+可控时间思考+编程工具,全球曾最成功的编码模型被替换了 数翼
2025-02-25
2
导读:Anthropic 深夜推出 **Claude 3.7 Sonnet**,是市场上**第一个混合推理模型**,API 用户还可以**精细控制模型可以思考多长时间**。并且发布了Claude Code工

 Anthropic 深夜推出 Claude 3.7 Sonnet1, 是迄今为止最智能的模型(评测中的表现), 也是市场上第一个混合推理模型

上周末我们预计本周 Claude 4.0 会发布, 然而 Anthropic 对于版本号没有那么激进。

新模型的特点

Claude 3.7 Sonnet 可以产生近乎即时的响应或扩展的、循序渐进的思考, 让用户可以看到。 API 用户还可以精细控制模型可以思考多长时间

Claude 3.7 Sonnet 在编码和前端 Web 开发方面显示出特别强大的改进。 除了该模型,我们还引入了一个用于代理编码的命令行工具 Claude Code。 Claude Code 作为有限的研究预览版提供, 使开发人员能够直接从其终端将大量工程任务委派给 Claude。

免费用户也可用 Claude 3.7

Claude 3.7 Sonnet 现在可用于所有 Claude 计划 (包括 FreeProTeam 和 Enterprise)以及 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI。 扩展思维模式可用于除免费 Claude 层之外的所有计划。

在标准和扩展思维模式下,Claude 3.7 Sonnet 的价格与其前辈相同: 每百万输入代币 3 美元,每百万输出代币 15 美元——其中包括思考代币。

Claude 3.7 混合推理理念

Claude 3.7 Sonnet 的理念与市场上的其他推理模型不同。

正如人类使用单个大脑进行快速反应和深度反思一样, Anthropic 认为推理应该是前沿模型的一种综合能力,而不是完全独立的模型。 这种统一的方法还为用户创造了更加无缝的体验。

Claude 如何实现混合推理

Claude 3.7 Sonnet 以多种方式体现了这一理念。

首先,Claude 3.7 Sonnet 既是一个普通的 LLM 又是一个推理模型: 你可以选择什么时候你希望模型正常回答,什么时候你希望它在回答之前思考更长时间。 在标准模式下,Claude 3.7 Sonnet 代表 Claude 3.5 Sonnet 的升级版本。 在扩展思维模式下,它会在回答之前进行自我反思, 从而提高了它在数学、物理、指令遵循、编码和许多其他任务上的表现。 我们通常发现,在两种模式下,模型的提示效果相似

其次,通过 API 使用 Claude 3.7 Sonnet 时, 用户还可以控制思考的预算:你可以告诉 Claude 思考不超过 N 个词元, 对于任何 N 的值,直到其 128K 词元的输出限制。 这允许您在速度(和成本)与答案质量之间进行权衡

第三,在开发推理模型时, 我们对数学和计算机科学竞争问题的优化有所减少, 而是将重点转移到更能反映企业实际如何使用 LLM 的实际任务上。

Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色

Claude Code

Anthropic 在有限的研究预览版中推出了他们第一个代理编码工具 Claude Code 来进一步增强开发人员的能力。

Claude Code 是一个积极的协作者, 可以搜索和读取代码编辑文件编写和运行测试提交代码并将其推送到 GitHub, 以及使用命令行工具。

大家可以通过 Claude Code 帮助文档[1] 查看详细信息。

Claude.ai 与 Github 集成

Claude.ai 目前以及将 GitHub 集成到了 Claude 计划上,所有 Claude 计划均可使用, 开发人员能够将其代码存储库直接连接到 Claude。

未来

上图展示了 Claude 在不同年份的发展阶段。

  • • 2024年 - Claude assists: Claude帮助个人更好地完成当前工作,使每个人成为最好的自己。
  • • 2025年 - Claude collaborates: Claude独立工作数小时,与专家合作,扩展每个个人或团队能够做到的事情。
  • • 2027年 - Claude pioneers: Claude为具有挑战性的问题找到突破性解决方案,这些问题可能需要团队多年才能实现。

最后

大模型的竞争真心激烈,对此我们还是要感谢 DeepSeek, 没有他的横空出世,大家不可能这么容易用到这么多,甚至是免费的工具(OpenAI、Grok3 相继免费)。

引用链接

[1] Claude Code 帮助文档: https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview


【声明】内容源于网络
0
0
数翼
专注 AIGC 人工智能知识传播和实践
内容 228
粉丝 0
数翼 专注 AIGC 人工智能知识传播和实践
总阅读29
粉丝0
内容228