
最近,《罗永浩的十字路口》访谈MiniMax创始人闫俊杰的视频在业内引发广泛关注。这场长达四小时的对话,不仅展现了两位风格迥异人物的思想碰撞,也揭示了中国新一代技术创业者在大模型时代下的信念与选择。
作为长期关注科技创业的观察者,我认为闫俊杰代表了一类罕见的技术创业者——追求“纯粹”的技术理想主义者。他的经历折射出中国AI创业从定制化项目到通用模型、从跟随模仿到自主创新的深刻转变。
一定要搞一次「纯粹」的技术创业
闫俊杰早年曾是商汤最年轻的CTO,亲历AI 1.0时代“为需求定制模型”的困局:每个项目都要单独开发,工具虽可复用,但模型无法通用,边际成本高,社会价值有限。这种模式难以支撑真正意义上的技术创业。
转折点出现在2020年,当他读到CLIP论文时意识到,文本与图像在深度学习底层本质统一,预训练模型有望实现通用智能。这一认知促使他决定All in大模型创业。
2022年底ChatGPT爆发时,MiniMax的Glow产品已处理亿级Token,体量一度超过早期ChatGPT。但闫俊杰清醒地认识到,产品形态受限于技术水位——“一个模型的能力,决定了产品的最终形态”。
一次参数调整导致对话质量轻微下降,三天内活跃用户即下滑30%,这让他更加确信:商业回报本质上是技术能力的直接映射。追求AGI与创造商业价值不再是两条平行线,而是重合的同一条路径——智能提升一分,用户留存就增加一分。
基于此逻辑,MiniMax做出多项关键决策:
- 2023年,在多数公司复现LLaMA时,MiniMax选择攻坚MoE(混合专家模型),尽管面临无开源参考、多次预训练失败、单次高达1500万美元算力成本的风险。
- 坚持全模态布局:即便资源有限,仍同步推进文本、语音、视觉三大方向,坚信真正的AGI必须是多模态的,并为未来融合做准备。
这些选择背后的核心,是对技术信仰的坚守,摒弃“算小账”的短视思维,专注于长期根本问题的解决。
在「冲击」里才能锻造「道路自信」
2025年初,DeepSeek R1的突然突破给国内大模型行业带来巨大冲击,许多团队陷入自我怀疑。闫俊杰坦承当时也经历了深刻反思:是否技术路线有误?团队是否降低了标准?是否在追求AGI的路上掺杂了杂念?
面对压力,他选择了更彻底的技术聚焦:放弃“沿途下蛋”做产品变现的路径,坚定投入模型研发。同时,在组织层面大幅加薪,稳定军心,凝聚注意力回归核心技术攻坚。
这一年,MiniMax接连打赢三场硬仗:
架构创新的抢跑
2025年1月发布国内首个线性注意力架构模型MiniMax-Text 01;6月开源全球首个大规模混合架构推理模型MiniMax-M1。尽管后续未完全沿用该架构,但其敢于偏离主流、探索无人区的精神,标志着从“跟随者”向“挑战者”的转变。
底层算法的反向输出
M1模型中提出的强化学习算法CISPO,被Meta在其ScaleRL框架中采用,成为中国创业公司在底层算法上对国际巨头的罕见技术输出。
定义交互的新标准
10月发布的M2模型引入Interleaved Thinking(交错思维链),实现“边想边做”的类人推理能力,迅速获OpenRouter等国际平台支持,推动行业交互范式升级。
随着M2发布,MiniMax补齐语言模型短板,文本、语音、视频、音乐四大模态均达国际前列。闫俊杰坦言:“客观来看,我们可能是中国唯一一家在全模态上都做到国际领先的公司。”
他指出,美国真正具备大模型竞争力的仅OpenAI、Google、Anthropic和X.AI四家。而中国公司的优势在于效率:“花美国同行1/50的成本,效果差距仅5%,且仍在缩小。”
他认为当前尚未完成多模态整合,“现在是我们最虚弱的时候”,但正因看清了技术路径的可行性,反而建立起更强的“道路自信”。
商业世界谈理想,不应再有「羞耻感」
长期以来,中国技术创业者往往被迫在理想与现实间妥协。技术常沦为商业叙事的陪衬,公开谈论“理想”甚至被视为不合时宜或“装腔作势”。
然而,大模型时代正在改变这一局面。当技术本身成为商业价值的核心驱动力,追求极致智能与获得市场回报形成闭环,“纯粹”的技术理想终于有了可持续的生存土壤。
闫俊杰与罗永浩的对话展现了一个新范式:不再将技术包装成迎合投资人的故事,而是构建一个自洽、统一、自带生命力的发展逻辑。只要足够相信这个“大一统”愿景,就可以坦荡表达并坚定执行。
他总结成功的关键是两个词:想象力与自信。美国企业擅长展示引领行业的雄心,中国科技企业也需要这种坦荡的自信。
正如DJI激励了无数硬件创业者追求全球顶尖产品一样,MiniMax的实践也为新一代技术创业者树立了榜样:在这个新时代,保持纯粹,心舟可渡万重山。

