大模型竞争下半场
Kimi深耕垂类Agent
与Minimax全栈突围
探寻技术突围与心智占领双重路径
中国大模型领域正经历着前所未有的格局重构。随着 DeepSeek 的横空出世,行业龙头从早期的 “六小龙” 演变为 “基模五强”,而 Kimi 与 Minimax 这两家曾被视为 “六小龙” 代表的创业公司,正通过技术突围与战略调整重新定义竞争逻辑。
在大厂主导的流量战场之外,Kimi 与 Minimax 选择在基础技术领域建立壁垒。Kimi 于 2025 年 6 月开源的编程模型 Kimi-Dev,基于 Qwen2.5-72B 微调,在 SWE-bench Verified 基准测试中以 60.4% 的成绩刷新开源模型纪录。其首个 Agent 产品 Kimi-Researcher 则聚焦深度研究场景,通过端到端自主强化学习技术,实现每个任务平均 23 步推理、74 个关键词规划和 206 个网址筛选,最终生成万字报告并引用 26 个可溯源信源。这种 “模型即 Agent” 的设计,直指金融、法律等对低幻觉、高信源要求的专业领域,从小红书等平台反馈看,其在论文撰写、行业分析等场景已形成差异化优势。Minimax 则以推理模型 M1 重塑开源能力边界。这个 4560 亿参数的 MoE 架构模型,原生支持 100 万 token 上下文输入和 8 万 token 输出,在专业上下文能力测评中超越 DeepSeek-R1 和 Qwen3-235B,仅小幅落后 Gemini 2.5 Pro。其核心创新在于混合注意力机制 —— 每 7 个线性注意力层穿插 1 个 Softmax 层,既保持线性复杂度的效率优势,又周期性整合标准注意力的模式捕捉能力。这种设计使 M1 在推理成本上仅为 DeepSeek R1 的 25%,同时实现多模态能力的全场景渗透,例如为抖音 “吴彦祖教英语” 提供技术支持,用户几乎无法分辨 AI 生成内容与真人的区别。
面对大厂在生活服务领域的密集布局,Kimi 与 Minimax 选择不同路径构建护城河。Kimi 将重心转向垂直 Agent,通过 “深度研究” 标签切割出金融、学术等专业赛道。这种策略避开了大厂的流量优势,同时依托其长文本技术积累(曾将长文本能力提升至 “中国 AGI 突破口” 高度),在法律、医疗等垂类场景建立技术壁垒。内测数据显示,Kimi-Researcher 生成的报告平均剔除 96.8% 的低质信息,且提供可交互网页作为输出形式,这种 “报告 + 网页” 的双模态交付方式,被评测博主 mactalk 评价为 “重新定义了内容交互范式”。Minimax 则延续全栈布局野心,通过多模态能力构建生态闭环。其产品矩阵涵盖文本、语音、视觉和视频生成,例如海螺 AI 整合长文本理解与视频生成技术,星野 App 以虚拟社交切入 C 端市场,Talkie 在海外实现 7000 万美元年收入。这种 “技术 + 产品” 的飞轮效应,使其在多模态应用领域形成差异化竞争力。例如,其视频生成模型 S2V-01 攻克 “人物一致性” 行业痛点,用一张照片生成风格多变但主角不变的视频,计算成本仅为传统方案的 1%。
Kimi 与 Minimax 的核心竞争力,本质上是创始团队对技术趋势的预判能力。杨植麟团队早在 2023 年便押注长文本技术,其论文与 DeepSeek 多次 “撞车”,例如 2024 年 2 月双方同时发布挑战 Transformer 注意力机制的研究成果,展现出对技术前沿的同步追踪能力。闫俊杰则在 2023 年将 80% 研发资源投入 MoE 架构,虽早期面临市场质疑,但随着 DeepSeek 的爆火,MoE 已成为行业主流技术路径,Minimax 的 ABAB6 模型作为国内首个 MoE 大模型,为其后续发展奠定基础。这种技术预判能力,在资本层面转化为持续的资源注入。Kimi 于 2024 年 2 月获得阿里领投的 8 亿美元融资,估值达 23.4 亿美元;Minimax 同年 3 月完成 6 亿美元融资,估值超 25 亿美元。投资者的逻辑清晰:相较于模型本身,团队对技术趋势的洞察力更具稀缺性。正如真格基金戴雨森所言:“我们投资的是团队,而非模型。在技术革命早期,拥有顶尖团队和资源的公司更有可能穿越周期。”
随着 DeepSeek-R1 等轻量化模型的出现,行业竞争从 “暴力计算” 转向效率优化。Kimi 与 Minimax 的技术路径,正印证着这种转变:Kimi-Dev 通过代码生成优化将开发效率提升 30%,Minimax-M1 的线性注意力机制使推理成本降低 75%。
这种效率革命不仅重构算力需求 —— 区域性数据中心因低时延优势承接制造业质检、金融风控等场景,ASIC 芯片厂商迎来发展机遇 —— 更催生新的商业模式。例如,Minimax 的 API 定价策略将推理成本降至行业最低,吸引中小企业采用其多模态技术。在开源与闭源的博弈中,两家公司展现出不同智慧。Kimi 通过开源 Kimi-Dev 构建开发者生态,同时保留垂直 Agent 的商业化授权;Minimax 则以 Apache 2.0 协议开放 M1 权重,试图挑战 Llama 在开源市场的主导地位,同时通过企业定制服务实现盈利。这种 “开源引流、闭源变现” 的策略,使它们在生态构建与商业变现之间找到平衡。
行业共识认为,大模型竞争已进入 “心智占领” 阶段。Kimi 与 Minimax 的每一次开源、每一个 Agent 迭代,都是在用户心智中刻下独特标签。Kimi 通过 “深度研究” 强化专业形象,Minimax 则以 “全栈多模态” 塑造技术全能者认知。这种差异化策略,使其在大厂与 DeepSeek 的夹缝中找到生存空间。对于创业公司而言,破局关键在于建立不可替代的认知优势。正如云启资本陈煜所言:“AI 下半场卖的不是工具,而是收益。”Kimi 的金融领域 Agent 已实现企业级客户的降本增效,Minimax 的多模态技术正在影视、教育等领域创造新价值。当行业泡沫消散,真正能穿越周期的,将是那些既能在技术深水区扎根,又能在用户心智中建立专业标签的团队。这场没有硝烟的战争,才刚刚开始。
-END-

