谁是世界上最强的大模型?这个问题争议很大。加密货币世界,交易者常常被情绪和信息不对称所困扰,但如果让 AI 模型来操盘,会发生什么?
10月18日,美国 nof1.ai 实验室在 “Alpha Arena” 平台上举办了一场AI投资公开赛,赛事主办方请到了全明星阵容,包括来自中国的 DeepSeek 和阿里通义的 Qwen3 Max,以及近几年人气很高的 Claude 和 Grok 4,再加上谷歌的 Gemini 2.5 和 OpenAI 的GPT 5 两位老牌选手,六个顶流大模型共聚一堂。
比赛规则也很简单,每个模型获得 10,000 美元的真实本金,投资包括比特币、以太坊在内的几种主流加密资产,方式是炒 Hyperliquid 上的永续合约,可以加杠杆,赌涨跌。但,规则很残酷:没人管、没套路、没剧本。与此同时,他们还给此次实验定下一个“三不原则”:首先,不给套路,“均线金叉买入、KDJ 超卖抄底”等技巧统统不教;其次,不给暗示,全程不许人工干预;最后,不给作弊机会,严格按时间过滤数据,让 AI 绝对看不到未来消息。期间,每个模型拿着一个账户和工具包去查价格、搜新闻和下单交易。至于怎么炒,全看它们的本事。因此,这是一次真正的 AI 自主交易,也填补了中国大模型研究在该领域的空白。
在控制变量的情况下,六个 AI 以“控制风险的前提下赚取尽可能多的收益”为目标,7x24 小时不间断地自主交易,Nof1 的官网(nof1.ai)清晰展示了实时价格图表和账户价值曲线,有趣的是,官方团队还专门增加了一项 BTC Holder 栏目作为对比,其策略为:仅仅买入并持有 BTC。
截止 11 月 4 日,17 天的实验,首轮 AI 炒币大赛收官,先来看看最终的成绩单:
Qwen 3 Max 账户余额 12,232 美元,净赚2,332 美元,涨幅 22.32%,夺得本次AI炒币大赛冠军, 赚钱能力最强;
DeepSeek 账户余额 10,489 美元,赚了 489 美元,涨幅 4.89%,拿下亚军;
Claude 账户余额 6,919 美元,亏了 3,081 美元,跌幅 30.81%,拿下季军;
Grok-4 账户余额 5,470 美元,亏了 4,530,跌幅 45%,获得第四名;
Gemini 2.5 Pro 账户余额 4,329 美元,亏了 5,671,跌幅 56.71%,获得第五名;
GPT-5账户余额 3734 美元,亏了 6,266,跌幅 62.66%,垫底。
从交易次数来看,前四名都在40 次左右,唯独 Gemini 2.5 Pro 和 GPT-5 交易次数有几百次,真是又菜又爱玩。
Twitter 上有人调侃:“连 AI 都搞不明白的 K 线,我亏也很正常。”
看来,“投资有风险,入市需谨慎”这句话,对 AI 同样适用。
在过去两周的模拟交易中,六个参与实验的 AI 模型整体表现不尽如人意,总资产缩水近三成,合计亏损约 16,827 美元。只有 Qwen3 Max 和 DeepSeek Chat V3.1 实现了盈利,其余四个模型则全部告负。
nof1.ai 的创始人表示,他们举办这场比赛的初衷,是想把 AI 从“标准答案”的考场中拉出来,扔进真实世界的交易斗兽场。
这场实验不仅揭示了大语言模型作为“量化交易员”的潜力与局限,也让人们第一次直观感受到,不同 AI 之间竟然存在性格与心智的差异。原来,AI 不止有智商,还有“财商”和“逆商”。
这场关于 AI 的鱿鱼游戏会越来越精彩。它将如何推动 AI 向着更通用、更强大的方向进化?让我们拭目以待。

