一、AI亟待解决的核心问题:为何同一问题,答案总不一样?
如果你多次向ChatGPT提问同一个问题,会发现得到的回答常常大相径庭。这种“随机性”并非AI的“个性”,而是行业长期以来的痛点——当前的AI模型被普遍认为是“非确定性系统”,其输出结果难以复现。
这一问题不仅困扰普通用户,更给企业和科研带来麻烦:依赖AI做数据分析的企业可能因结果波动导致决策偏差;科研人员难以基于随机输出验证实验结论;就连AI自身的迭代核心技术“强化学习”(通过奖励正确答案优化模型),也会因答案不一致产生“数据噪音”,影响训练效率。
二、Mira Murati与她的Thinking Machines Lab:明星实验室的“硬核配置”
要解决这一核心难题的,正是前OpenAI首席技术官Mira Murati创办的Thinking Machines Lab(思维机器实验室)。这家被业内寄予厚望的实验室,自带“顶配”光环:
资金实力:手握20亿美元种子轮融资,为前沿研究提供充足底气;
人才阵容:集结了一众OpenAI前顶尖研究员,组建了“全明星”研发团队;
估值表现:凭借强大的背景与潜力,当前估值已达到120亿美元;
核心愿景:攻克AI领域的关键难题,首当其冲便是解决模型输出的“非确定性”,打造可复现响应的AI。
三、破局思路:问题根源在GPU内核,管控编排是关键
近日,实验室通过首篇技术博客《Defeating Nondeterminism in LLM Inference》(攻克大语言模型推理中的非确定性),首次公开了破局思路。研究员Horace He指出:
AI输出的随机性,根源在于GPU内核的编排方式。当用户输入问题后,AI进入“推理阶段”——此时运行在英伟达芯片中的小型程序(即GPU内核)需协同工作生成答案。但目前这些内核的组合与调度缺乏精准控制,最终导致输出结果不稳定。
Horace He认为,只要对GPU内核的“编排层”进行精细化管控,就能让AI模型从“不可预测”转向“可复现”,彻底解决随机性问题。
四、解决随机性的深层价值:不止“靠谱”,更赋能行业
攻克随机性的意义,远不止让AI回答更“稳定”:
赋能企业与科研:为依赖AI的企业提供可靠输出,减少决策风险;帮助科研人员基于可复现结果推进研究,提升效率;
优化AI训练:让强化学习过程更“顺畅”——消除数据噪音后,模型能更精准地通过“奖励机制”迭代升级。这也与实验室的战略规划契合:此前有报道称,其计划利用强化学习为企业定制AI模型。
五、开放承诺与未来布局:首款产品即将亮相
除了公开技术方向,Thinking Machines Lab还宣布启动名为“Connectionism”(联结主义)的系列博客,承诺未来将定期发布技术博文、代码及研究细节。实验室表示,这一举措旨在“既造福公众,也完善自身研究文化”——这与OpenAI创立初期的开放理念一致,但后者已随规模扩大转向封闭,因此Murati团队能否坚守承诺备受关注。
此外,Mira Murati在7月曾透露,实验室首款产品将在未来几个月发布,且“对开发定制模型的研究员和初创公司有用”。目前尚未明确该产品是否会应用“反随机性”技术,但外界对其落地效果充满期待。
六、结语:120亿美元估值下的“大考”
从资金、人才到技术方向,Thinking Machines Lab已展现出冲击AI前沿难题的实力。但真正的考验才刚刚开始:它不仅需要成功攻克“非确定性”等技术难关,更要将研究成果转化为落地产品——唯有如此,才能支撑起120亿美元的估值,真正改写AI行业的发展轨迹。这家明星实验室的下一步动作,值得全行业关注。

