智谱今年三次上调API价格,累计涨幅达83%,接口调用量逆势增长400%,彰显市场需求强劲。此现象源于全球算力供需失衡——美国H100 GPU租赁价年内上涨近40%。国产AI模型已结束“价格仅为Cursor 1/66”的低价阶段,全面涨价标志着其与国际头部厂商的直接竞争。
一、国内外定价差异凸显
近期,海外开发者社群热议如何注册支付宝或微信支付以享用中国AI服务。核心动因在于智谱GLM Coding Plan的价差:中国区Max套餐月费469元(约68美元),海外版售价160美元,相差超一倍。
尽管早期海外促销价低至3美元/月,但2026年多次涨价后,海外版价格已达国区2-3倍。智谱国区同期也调价:Lite档从120次/5小时降至80次,配额缩减三分之一。企业方解释称,系“市场需求强劲增长”,需加大算力投入保障服务稳定性。
区域差价反映全球SaaS行业通行逻辑:欧美开发者对10-30美元/月生产力工具接受度高,海外服务需承担国际节点、支付渠道等附加成本,同时面向高ARPU市场追求单用户收入。
实际中,海外用户“跨区”面临额度售罄等挑战。部分用户转向海外版包年套餐实现价格接近,但实测显示GLM5.1额度消耗略高于Claude,性价比仍存优势。
二、行业定价机制与竞争动态
2026年,主流国产模型国内CodingPlan月费集中于40-50元。MiniMax以29元起价主打性价比,仅支持M2系列模型,一季度Token调用量登顶全球榜单。
业内对低价可持续性质疑升温。小米MiMo负责人罗福莉呼吁:厂商需先厘清“codingplan定价不亏钱”逻辑,避免盲目价格战。
行业普遍采用“5小时滚动刷新+周上限”配额模式平衡资源占用。模型消耗系数差异化:智谱GLM5高峰时段消耗3倍配额,MiniMax通过缓存机制抵消消耗至0.7元/百万tokens,开发者需结合工作流精算成本。
三、算力供需失衡与市场展望
算力短缺问题持续加剧。Semi Analysis数据显示,H100租赁价从2025年10月的1.70美元/小时升至2026年3月的2.35美元/小时,涨幅近40%。国产GPU如摩尔线程MTTS5000加速接入模型体系,支持GLM-5.1等新架构。
智谱财报印证市场韧性:一季度接口价格涨83%但调用量增400%。资本市场积极反馈,其港股市值达4200亿港元,显著超越MiniMax。涨价虽引发用户争议,但调用量回归常态后模型响应平顺性提升。
随着国产模型在性能、稳定性及生态支持上逼近国际水平,叠加算力供需再平衡,行业正式告别低价时代,进入以服务价值为核心的竞争新阶段。

