新智元报道
编辑:桃子 好困
【新智元导读】Claude发布"顾问策略",让Opus 4.6退居幕后担任决策顾问,Sonnet/Haiku负责执行。实测性能提升2.7%,成本降低85%,彻底革新大模型工作流。
Anthropic正式推出Claude"顾问策略"(Advisor Strategy),重构了多模型协作逻辑:
- 顶级模型Opus 4.6作为决策顾问,仅在关键节点介入
- Sonnet 4.6或Haiku 4.5承担全流程执行任务
该架构颠覆传统"大模型拆解任务、小模型执行"模式:执行者独立处理常规流程,仅当遇到复杂难题时自动调用Opus提供策略指导。测试数据显示:
|
|
- SWE-bench编程测试: "Sonnet 4.6+Opus" 成本降低11.9%,得分提升2.7%
- BrowseComp测试: "Haiku 4.5+Opus" 性能翻倍,成本降至Sonnet的15%
开发者评价"享受Opus级别性能,却无需支付Opus成本"。
Claude智能体系升级
传统模式需顶级模型全程参与任务拆解,每条请求均消耗高成本Token。顾问策略的核心突破在于:
- 执行者角色:Sonnet/Haiku负责端到端任务执行与工具调用
- 顾问角色:Opus基于共享上下文提供决策指导,不直接与用户交互
在Terminal-Bench 2.0测试中:
- 智能搜索任务:性能提升2.3%,成本6.13美元
- 终端编码任务:性能提升3.8%,成本0.88美元
Haiku组合特别适合高并发场景——在BrowseComp测试中成本降低85%,成为批量处理任务的理想方案。
高效调用指南
通过Messages API单行代码即可启用顾问策略:
response = client.messages.create(
model="claude-sonnet-4-6", # 执行者
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3,
},
],
messages=[...]
)
# 顾问消耗Token按Opus定价独立计费
关键技术特性:
- 顾问每次调用仅生成400-700 Token的决策指令
- max_uses参数可限制单次请求的顾问调用次数
- 顾问消耗Token在用量信息中单独列出
Agent效率革新
配套推出的Monitor功能实现Agent运行模式变革:
- 将传统轮询监控改为事件驱动机制
- 后台脚本持续监控系统日志/PR状态,无活动不消耗Token
结合Managed Agents(0.08美元/小时)和MCP Connectors(集成Asana、Notion等工具),Anthropic构建完整Agent运行平台:
- 顾问策略优化模型调度
- Monitor提升空闲时段效率
- Managed Agents简化基础设施管理
- MCP Connectors扩展工具生态
企业级数据显示:年化营收突破300亿美元,企业AI收入与OpenAI份额已达50:50。Sentry、Notion等头部企业已接入该平台体系。
模型规模揭秘
行业最新披露:
- Claude Sonnet参数量约1T
- Claude Opus参数量约5T
- 代号Mythos的新型号或达10T级别
Anthropic正在探索自研AI芯片,持续强化技术栈全栈布局。




