大数跨境
0
0

坐拥100亿现金,手握300亿独角兽!90后潮汕小伙却说:再等等

坐拥100亿现金,手握300亿独角兽!90后潮汕小伙却说:再等等 商业MMBA
2026-01-05
3
导读:往山顶,我们又走了一段距离。

月之暗面:杨植麟的AI攀登之路

2025年12月31日晚10点,北京后厂村,月之暗面算法工程师李哲刷新公司内部系统,一封全员信弹出。创始人杨植麟在年度总结中写道:“2026年,我们的核心目标是让K3模型能力提升十倍。至于上市,短期不着急。”

三小时后,这张截图连同“月之暗面估值300亿”“现金储备超百亿”的消息,在投资人圈层迅速传播。此时距智谱AI港股挂牌仅剩6天,MiniMax也即将举办上市酒会,两家正争夺“全球大模型第一股”称号。

然而,月之暗面仅凭私募融资便获得5亿美元,远超多数企业IPO募资额。其账上现金超100亿元人民币,几乎相当于智谱(约25.5亿)与MiniMax(约73亿)之和。

技术出身的创业者

杨植麟出生于广东汕头澄海,当地以玩具制造闻名。高中时因信息学竞赛获广东一等奖,保送清华大学。高考仍以667分成为汕头理科状元,进入热能工程系。大二受村上春树启发转学计算机,后以年级第一成绩赴卡内基梅隆大学攻读博士。

他在读博期间作为第一作者发表的Transformer-XL和XLNet论文,成为大语言模型关键技术基础,累计引用超2.2万次。

从高光到低谷再到逆袭

2023年3月,杨植麟创立月之暗面(Moonshot AI),灵感来自平克·弗洛伊德专辑《The Dark Side of the Moon》。团队会议室以传奇乐队命名,办公区配备电吉他与钢琴,产品Kimi界面极简,回答风格理性客观。

成立三个月即完成2亿美元融资,红杉中国、真格基金等争相入局;2024年2月再获超10亿美元融资,创下国内AI大模型单轮最高纪录,公司估值一度达30亿美元。

但2024年底,DeepSeek发布R1模型,性能碾压同期Kimi 1.5,导致月之暗面市场份额下滑,To C推广暂停,并陷入前投资方股权纠纷。

闭关攻坚与技术突破

2025年初,月之暗面淡出公众视野。杨植麟叫停70%营销支出,集中资源攻坚底层模型。内部推行“文档对齐”机制,提升协作效率。

核心研究员苏剑林开发的RoPE位置编码技术,解决长序列处理难题,已成为行业主流方案。该员工也是公司唯一被允许居家办公者。

2025年7月11日,月之暗面突然开源Kimi K2模型——参数达1万亿的MoE架构,在LMSYS权威评测中位列第四,超越DeepSeek-R1。

GitStar数24小时内突破1.8万,《自然》杂志评价为“又一个DeepSeek时刻”。硅谷开发者开始关注其线性注意力架构创新。

K2采用混合线性注意力结构并插入全注意力层,结合细粒度门控机制,在保持性能的同时显著降低算力成本。同年10月开源的Kimi Linear架构,进一步优化短/长上下文表现。

联合创始人吴育昕在Reddit访谈中表示:“DeepSeek的OCR路线太刻意,我们更倾向通用方法。”11月发布的K2 Thinking推理模型支持INT4权重量化,适配英伟达低端GPU及国产芯片。

商业化挑战与未来方向

尽管技术领先,商业化仍是难题。2025年9月,月之暗面推出三档会员订阅制(49元/月、99元/月、199元/月),按请求次数计费。市场反馈认为性价比偏低,团队回应称定价基于后端成本,未来或调整为按字数计费。

同期,智谱AI估值已达400亿元,MiniMax新一轮融资后估值达300亿元。

面对压力,杨植麟在内部立下目标:2026年通过K3实现能力十倍提升,聚焦Agent智能体研发,推动AI从“聊天”向“执行任务”进化。

其办公桌上常放一本《无穷的开始》,书中理念“问题是不可避免的,问题是可以解决的”深刻影响着团队文化。

当同行忙于上市路演时,杨植麟带领团队持续打磨OK Computer等工具调用功能。他在2025年末内部信中写道:“往山顶,我们又走了一段距离。”而真正的山巅,他选择用时间与耐心去抵达。

【声明】内容源于网络
0
0
商业MMBA
“商界内参”一个让你事业少走弯路的公众号
内容 3932
粉丝 0
商业MMBA “商界内参”一个让你事业少走弯路的公众号
总阅读176.7k
粉丝0
内容3.9k