1 BTC=109417 USD (2025-10-21)


实盘实时监测链接如下:https://nof1.ai/
上周六(10月18 日),美国人工智能研究实验室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上发起了一场大胆实验——给予六个顶级语言模型各自1万美元真金白银,让它们下场在真实市场(加密永续合约)交易。与模拟盘不同,这是真实资金、实时交易、互相竞赛。本文基于最新可得数据,带你复盘这场实验:规则是什么?表现如何?它对AI+交易意味着什么?
第一部分:实验规则与参赛模型
此次实验由nof1.ai主办,其平台Alpha Arena定位为“AI 模型在实盘环境进行交易能力”的基准测试。参赛模型包括六大主流语言模型(LLM):
•Claude 4.5 Sonnet(由Anthropic 推出)
•DeepSeek V3.1 Chat(由深度求索 推出)
•Gemini 2.5 Pro(由Google/DeepMind 推出)
•GPT 5(由OpenAI 推出)
•Grok 4(由xAI 推出)
•Qwen 3 Max(由阿里巴巴/通义推出)
每个模型获得10,000美元初始资金,在加密交易所Hyperliquid上交易永续合约。每个模型使用同样提示词、同样输入数据,系统向它们提供当前时间、账户信息、持仓状况、价格及指标数据。模型须独立决定:若持仓则继续持有或平仓;若空仓则买入或继续观望。比赛目标为“风险调整后收益最大化”(即模型必须自行产生超额收益、确定仓位、择时交易并管理风险)。
第二部分:最新进展情况
截至北京时间10月21日上午8点,最新排行榜与行情显示如下(数据为公开平台所示,实际可能稍有变动):
•DeepSeek V3.1 Chat:目前总账户市值约13,500美元以上,收益率超过30%。
•Grok 4:次优表现,市值约13,100 美元左右,收益率亦超过30%。
•Claude 4.5 Sonnet:当前市值约12,300–12,500 美元。
•Qwen 3 Max:市值约9,700–9,800 美元。
•GPT 5:市值约7,100–7,700 美元。
•Gemini 2.5 Pro:市值约6,400–6,900 美元。
综上可见:在这场实盘测试中,表现最好的两款模型(DeepSeek、Grok)已实现超过30%的短期收益;而表现落后的(GPT 5、Gemini)则已出现约30-40%的亏损。
(六大模型 最新持仓情况)
第三部分:这场实验的关键观察
几点值得重点提炼:
1.AI模型在真实高波动市场中可取得较强表现,但并非万能,深度求索(DeepSeek)与Grok 的优异表现说明,AI模型在短期内通过系统化交易逻辑、有利仓位选择与杠杆运用,可以创造明显超越常规现金/比特币现货的收益。但同时,GPT 5与Gemini的亏损提醒我们:语言理解能力≠金融实盘交易能力。交易还包括仓位管理、风控、流动性冲击、清算风险等。
2.仓位、杠杆、风险管理是关键
多篇报道指出,DeepSeek采用“多主流币做多+适度杠杆+分散仓位”策略,这帮助其脱颖而出。
在高杠杆永续市场中,仅有方向判断是不够的:实际执行、止损、仓位控制才是决定成败的重要因素。
3.真实交易环境远比静态测试复杂
主办方明确指出,选择金融市场作为试炼,是因为市场具有“动态性、对抗性、开放性、高度不可预测性” 的特质。
这意味着,AI模型不仅需要“看懂”数据,更要“参与”环境、实时决策、与其他市场参与者互动。
4.AI+交易生态可能正在加速形成
媒体与行业人士已开始讨论:“DeFi+AI”(即“DeFAI”)是否将成为下一波投资工具。AI 模型不仅做交易,还可能参与流动性提供、链上协议决策、套利、MEV 捕捉等。
这场实验或只是一场预演,但它所释放出的信号值得市场关注。
第四部分:值得思考的问题与未来走向
1.如果越来越多AI模型参与交易,会带来什么?
•若多个高性能模型使用相似策略或提示词,则可能出现“策略同步”现象:大量模型在同一时间买入/卖出,或许引发市场的同步冲击或流动性事件。前Binance CEO赵长鹏就对此表达担忧。
•由于策略公开透明,可能被模仿或被用于前置套利,减少模型优势。
•市场结构可能因此改变:AI模型参与度越高,交易节奏越快,可能导致波动性上升、清算事件频发。
2.对投资者/机构而言意味着什么?
•不能简单将“AI 模型能赚钱”作为结论:需警惕其稳定性、策略同质化、以及隐藏风险。
•包括普通投资者在内,未来可能要将“是否被AI交易夹击”列入风险考量:现金、债券、传统资产可能不再“零风险”。
•对机构而言,开发或采用专用交易AI模型可能成为竞争优势;但同时需监管、合规、策略多样化、监控机制同步升级。
3.对LLM发展与金融市场的意义
•语言模型正从“生成+理解文本”走向“理解+决策+执行”——这意味着其边界正在扩展。
•金融市场(尤其加密永续)成为LLM能力展示、评估的新前沿。但也是风险测试场:爆仓、清算、同步崩盘可能随时发生。
•在技术路径上,专为交易设计的模型(LLM+强化学习/风控模块)将更具竞争力,而不仅仅是通用聊天模型。
最后多说一句,这场由nof1.ai发起的Alpha Arena比赛,用六大主流语言模型以真实资金参与加密市场,为我们提供了一个非常直观的“AI在交易实盘”测试窗口。这场比赛所揭示的不是一夜间让AI成为“万能交易者”的故事,而是当AI涉足真实高波动市场时,胜负不仅取决于“预测哪方向”,更在于“仓位、风控、执行、策略再造”。
对我们每一个人而言,关键不是盲目相信“AI 帮你赚钱”,而是思考:你所在的资产配置、风险管理、交易逻辑,在AI浪潮下准备好了没有?当交易生态变得“人+机混合、策略+模型博弈”时,你如何定位自己?
未来或许不是“人战AI”,而是“人机共同进化”。这场实盘实验只是一个开始——真正的大戏,才刚刚拉开帷幕。



「进交流群 请添加 企业微信」





