国产AI雄起！DeepSeek R1：最强开源模型，剑指OpenAI！- 大数跨境

鳌峻睿敏

2025-01-25

大家好，今天给大家介绍一款最近火爆全网的模型——DeepSeek R1！它是由国内量化巨头幻方量化倾力打造的，一经发布就引起了AI圈的巨大震动。

说到幻方，大家可能对它在大A股市场的“收割”印象深刻（手动狗头）。但不得不承认，人家在AI领域的实力也是杠杠的！前段时间，幻方仅用557万美元、2000块GPU，就训练出了一个6700亿参数的超大模型，这效率简直逆天！要知道，川普最近还宣布要投入5000亿美元建设AI基础设施“星际之门”，由软银、OpenAI和甲骨文三大巨头领衔，规模堪比当年的“曼哈顿计划”。可见，美国在高科技领域的投入是何等豪横。

但有了DeepSeek这样的模型，我们底气更足了！现在的AI军备竞赛，本质上是算力与能源的比拼，这个比值越高，就代表在AI领域越先进、越有竞争力。虽然美国的电价（约9毛人民币）比中国商业电价（6毛多）贵，但我们在算力方面和他们还有一定差距。而DeepSeek的出现，恰好弥补了这一短板！

DeepSeek采用的是混合专家模式，简单来说，就是把数学、医学等各领域的“专家”请到一个会议室，针对一个问题进行“会诊”。这种模式可以用极小的硬件规模，达到极高的效率。我们完全可以把省下来的钱补贴给硬件企业，再加上我们在能源方面的优势，国产AI的发展就能驶入快车道，真正具备和美国掰手腕的实力！

DeepSeek R1到底有多牛？

DeepSeek的官方微信公众号“深度求索”最近发布了最新模型DeepSeek R1，它有以下三大亮点，绝对让你直呼过瘾！

1. 超级开放！

R1遵循MIT协议，允许用户通过蒸馏技术，借助R1训练其他模型。这和OpenAI的闭源模式形成了鲜明对比！DeepSeek的开放程度，堪称开源领域最宽松的协议之一，意味着每个人、每个单位都可以自由使用这个模型！更良心的是，它还发布了一系列蒸馏模型，从1.5B到70B，各种大小任君选择！

在性能上，1.5B模型在多项数据上已经碾压了GPT-3.5、GPT-4和Claude 3.5！由于资源占用极小，甚至能在最新的手机上流畅运行！而32B和70B的模型，在多项能力上实现了对标O1 mini的效果，表现非常抢眼！这不仅是性能上的对标，更是性价比的碾压！R1每百万token输出的成本仅为O1的1/30！性能相近，价格却是天壤之别，各位老板会怎么选，不用我多说了吧？

2. 深度思考！

R1对用户开放思维链的输出，能让你亲眼见证AI的思考过程！它会不断地假设、证明、证伪，再假设再证伪，直至得出正确的答案，并且还能进行验算！在实际测试中，R1展现出了强大的推理能力，无论是数学题、化学题还是密码题，都能给出准确的答案。这种思维链输出功能，比很多闭源模型要透明得多，更方便我们研究和使用AI！

3. 官网&APP同步上线！

DeepSeek的官网和APP已经同步上线，方便大家第一时间体验这款强大的模型！

实战测试，实力说话！

光说不练假把式，我们直接上干货！我用几道经典的奥数题、脑筋急转弯题和逻辑题对DeepSeek R1进行了测试，结果简直惊艳！

**奥数题：**轻松拿下，答案准确，推理过程清晰，完全是学生做题的思路！
**脑筋急转弯：**各种刁钻的问题都能对答如流，甚至还能解释其中的逻辑，简直太聪明了！
**爱因斯坦的斑马谜题：**R1竟然列出了表格，一步步推导出正确答案，逻辑缜密，令人叹服！

毫不夸张地说，我愿称DeepSeek R1是目前最强的开源模型！如果OpenAI继续保持闭源状态，很快就会被这种开源模型超越，失去头部优势！

DeepSeek的发布极具诚意，直接公开了模型和技术文档，不像OpenAI那样搞各种访谈、圆桌会，营造神秘感。幻方能做出这样的模型，我一点都不意外，毕竟人家公司聚集了一大批数学家、密码学家、金融学家等各领域专家，天生就具备训练大模型的人才和算力基础！

让我们一起期待下一个DeepSeek，期待一个全面超越OpenAI的开源模型的发布！国产AI，未来可期！

【声明】内容源于网络

鳌峻睿敏

风起于青萍之末浪成于微澜之间

内容 5

粉丝 0

鳌峻睿敏风起于青萍之末浪成于微澜之间

总阅读3

粉丝0

内容5