大模型竞争下半场：Kimi 深耕垂类 Agent 与 Minimax 全栈突围，探寻技术突围与心智占领双重路径- 大数跨境

首页

大模型竞争下半场：Kimi 深耕垂类 Agent 与 Minimax 全栈突围，探寻技术突围与心智占领双重路径

元龙数字智能科技

2025-07-02

大模型竞争下半场

Kimi深耕垂类Agent

与Minimax全栈突围

探寻技术突围与心智占领双重路径

中国大模型领域正经历着前所未有的格局重构。随着 DeepSeek 的横空出世，行业龙头从早期的 “六小龙” 演变为 “基模五强”，而 Kimi 与 Minimax 这两家曾被视为 “六小龙” 代表的创业公司，正通过技术突围与战略调整重新定义竞争逻辑。

在大厂主导的流量战场之外，Kimi 与 Minimax 选择在基础技术领域建立壁垒。Kimi 于 2025 年 6 月开源的编程模型 Kimi-Dev，基于 Qwen2.5-72B 微调，在 SWE-bench Verified 基准测试中以 60.4% 的成绩刷新开源模型纪录。其首个 Agent 产品 Kimi-Researcher 则聚焦深度研究场景，通过端到端自主强化学习技术，实现每个任务平均 23 步推理、74 个关键词规划和 206 个网址筛选，最终生成万字报告并引用 26 个可溯源信源。这种 “模型即 Agent” 的设计，直指金融、法律等对低幻觉、高信源要求的专业领域，从小红书等平台反馈看，其在论文撰写、行业分析等场景已形成差异化优势。Minimax 则以推理模型 M1 重塑开源能力边界。这个 4560 亿参数的 MoE 架构模型，原生支持 100 万 token 上下文输入和 8 万 token 输出，在专业上下文能力测评中超越 DeepSeek-R1 和 Qwen3-235B，仅小幅落后 Gemini 2.5 Pro。其核心创新在于混合注意力机制 —— 每 7 个线性注意力层穿插 1 个 Softmax 层，既保持线性复杂度的效率优势，又周期性整合标准注意力的模式捕捉能力。这种设计使 M1 在推理成本上仅为 DeepSeek R1 的 25%，同时实现多模态能力的全场景渗透，例如为抖音 “吴彦祖教英语” 提供技术支持，用户几乎无法分辨 AI 生成内容与真人的区别。

面对大厂在生活服务领域的密集布局，Kimi 与 Minimax 选择不同路径构建护城河。Kimi 将重心转向垂直 Agent，通过 “深度研究” 标签切割出金融、学术等专业赛道。这种策略避开了大厂的流量优势，同时依托其长文本技术积累（曾将长文本能力提升至 “中国 AGI 突破口” 高度），在法律、医疗等垂类场景建立技术壁垒。内测数据显示，Kimi-Researcher 生成的报告平均剔除 96.8% 的低质信息，且提供可交互网页作为输出形式，这种 “报告 + 网页” 的双模态交付方式，被评测博主 mactalk 评价为 “重新定义了内容交互范式”。Minimax 则延续全栈布局野心，通过多模态能力构建生态闭环。其产品矩阵涵盖文本、语音、视觉和视频生成，例如海螺 AI 整合长文本理解与视频生成技术，星野 App 以虚拟社交切入 C 端市场，Talkie 在海外实现 7000 万美元年收入。这种 “技术 + 产品” 的飞轮效应，使其在多模态应用领域形成差异化竞争力。例如，其视频生成模型 S2V-01 攻克 “人物一致性” 行业痛点，用一张照片生成风格多变但主角不变的视频，计算成本仅为传统方案的 1%。

Kimi 与 Minimax 的核心竞争力，本质上是创始团队对技术趋势的预判能力。杨植麟团队早在 2023 年便押注长文本技术，其论文与 DeepSeek 多次 “撞车”，例如 2024 年 2 月双方同时发布挑战 Transformer 注意力机制的研究成果，展现出对技术前沿的同步追踪能力。闫俊杰则在 2023 年将 80% 研发资源投入 MoE 架构，虽早期面临市场质疑，但随着 DeepSeek 的爆火，MoE 已成为行业主流技术路径，Minimax 的 ABAB6 模型作为国内首个 MoE 大模型，为其后续发展奠定基础。这种技术预判能力，在资本层面转化为持续的资源注入。Kimi 于 2024 年 2 月获得阿里领投的 8 亿美元融资，估值达 23.4 亿美元；Minimax 同年 3 月完成 6 亿美元融资，估值超 25 亿美元。投资者的逻辑清晰：相较于模型本身，团队对技术趋势的洞察力更具稀缺性。正如真格基金戴雨森所言：“我们投资的是团队，而非模型。在技术革命早期，拥有顶尖团队和资源的公司更有可能穿越周期。”

随着 DeepSeek-R1 等轻量化模型的出现，行业竞争从 “暴力计算” 转向效率优化。Kimi 与 Minimax 的技术路径，正印证着这种转变：Kimi-Dev 通过代码生成优化将开发效率提升 30%，Minimax-M1 的线性注意力机制使推理成本降低 75%。

这种效率革命不仅重构算力需求 —— 区域性数据中心因低时延优势承接制造业质检、金融风控等场景，ASIC 芯片厂商迎来发展机遇 —— 更催生新的商业模式。例如，Minimax 的 API 定价策略将推理成本降至行业最低，吸引中小企业采用其多模态技术。在开源与闭源的博弈中，两家公司展现出不同智慧。Kimi 通过开源 Kimi-Dev 构建开发者生态，同时保留垂直 Agent 的商业化授权；Minimax 则以 Apache 2.0 协议开放 M1 权重，试图挑战 Llama 在开源市场的主导地位，同时通过企业定制服务实现盈利。这种 “开源引流、闭源变现” 的策略，使它们在生态构建与商业变现之间找到平衡。

行业共识认为，大模型竞争已进入 “心智占领” 阶段。Kimi 与 Minimax 的每一次开源、每一个 Agent 迭代，都是在用户心智中刻下独特标签。Kimi 通过 “深度研究” 强化专业形象，Minimax 则以 “全栈多模态” 塑造技术全能者认知。这种差异化策略，使其在大厂与 DeepSeek 的夹缝中找到生存空间。对于创业公司而言，破局关键在于建立不可替代的认知优势。正如云启资本陈煜所言：“AI 下半场卖的不是工具，而是收益。”Kimi 的金融领域 Agent 已实现企业级客户的降本增效，Minimax 的多模态技术正在影视、教育等领域创造新价值。当行业泡沫消散，真正能穿越周期的，将是那些既能在技术深水区扎根，又能在用户心智中建立专业标签的团队。这场没有硝烟的战争，才刚刚开始。