大数跨境

Cursor自研模型反超Opus 4.6!价格脚踝斩,氛围编程沸腾了

Cursor自研模型反超Opus 4.6!价格脚踝斩,氛围编程沸腾了 量子位
2026-03-20
3
导读:背后引入了新的强化学习方法

市场格局发生重大变化!Cursor最新编程模型不仅性能超越Claude Opus 4.6,价格也显著降低。

Cursor曾以提供Claude模型服务获得关注,如今其自研编程模型Composer 2已实现技术突破。

该模型在多项基准测试中超越Claude Opus 4.6,价格降幅显著。

在全球大模型服务普遍涨价的背景下,Cursor如何实现成本优化?其核心突破在于采用新型强化学习方法。

性能超越Opus 4.6,成本显著优化

已上线的Composer 2聚焦编程领域性价比提升。在Terminal-Bench 2.0和SWE-bench Multilingual等基准测试中,其性能居于GPT-5.4与Claude Opus 4.6之间。

定价方面,Composer 2标准版输入价格为0.5美元/百万tokens(约合3.5元人民币),输出价格为2.5美元/百万tokens(约合17.2元人民币)。

同步推出的Composer 2 Fast在保持同等智能水平的同时提升运算速度,输入定价1.5美元/百万tokens(约合10.3元人民币),输出定价7.5美元/百万tokens(约合51.7元人民币)。

成本优势源于新型强化学习方法的实质应用,该方法直接训练模型获得能力,而非推理技巧优化。

基于自我总结的强化学习方法

该方法通过训练模型主动生成阶段性总结,突破长上下文任务瓶颈。

传统方案依赖上下文压缩技术,易导致关键信息丢失。而Cursor采用自我总结机制:模型在固定token长度触发点暂停,主动生成上下文摘要,将关键信息传递至后续步骤。

训练过程中,总结质量直接影响任务成功率并被纳入奖励机制:

  • 优质总结促进任务完成获得高奖励
  • 信息丢失导致任务失败受到惩罚

该方法使模型精准识别关键信息,实测中token消耗降至传统方案的1/5,任务错误率降低50%。在复杂工程任务(如将Doom游戏迁移至MIPS架构)中,模型成功处理超10万tokens任务,压缩至1000 tokens完成。

内部测试证实,Composer通过训练循环整合压缩机制,显著提升高难度长链条任务处理能力。目前Composer 3研发已启动,Cursor作为兼具模型开发与应用服务的新型企业,持续推动技术边界。

【声明】内容源于网络
0
0
量子位
各类跨境出海行业相关资讯
内容 14889
粉丝 0
量子位 各类跨境出海行业相关资讯
总阅读154.4k
粉丝0
内容14.9k