市场格局发生重大变化!Cursor最新编程模型不仅性能超越Claude Opus 4.6,价格也显著降低。
Cursor曾以提供Claude模型服务获得关注,如今其自研编程模型Composer 2已实现技术突破。
该模型在多项基准测试中超越Claude Opus 4.6,价格降幅显著。
在全球大模型服务普遍涨价的背景下,Cursor如何实现成本优化?其核心突破在于采用新型强化学习方法。
性能超越Opus 4.6,成本显著优化
已上线的Composer 2聚焦编程领域性价比提升。在Terminal-Bench 2.0和SWE-bench Multilingual等基准测试中,其性能居于GPT-5.4与Claude Opus 4.6之间。
定价方面,Composer 2标准版输入价格为0.5美元/百万tokens(约合3.5元人民币),输出价格为2.5美元/百万tokens(约合17.2元人民币)。
同步推出的Composer 2 Fast在保持同等智能水平的同时提升运算速度,输入定价1.5美元/百万tokens(约合10.3元人民币),输出定价7.5美元/百万tokens(约合51.7元人民币)。
成本优势源于新型强化学习方法的实质应用,该方法直接训练模型获得能力,而非推理技巧优化。
基于自我总结的强化学习方法
该方法通过训练模型主动生成阶段性总结,突破长上下文任务瓶颈。
传统方案依赖上下文压缩技术,易导致关键信息丢失。而Cursor采用自我总结机制:模型在固定token长度触发点暂停,主动生成上下文摘要,将关键信息传递至后续步骤。
-
优质总结促进任务完成获得高奖励 -
信息丢失导致任务失败受到惩罚
该方法使模型精准识别关键信息,实测中token消耗降至传统方案的1/5,任务错误率降低50%。在复杂工程任务(如将Doom游戏迁移至MIPS架构)中,模型成功处理超10万tokens任务,压缩至1000 tokens完成。
内部测试证实,Composer通过训练循环整合压缩机制,显著提升高难度长链条任务处理能力。目前Composer 3研发已启动,Cursor作为兼具模型开发与应用服务的新型企业,持续推动技术边界。

