大数跨境

国产AI雄起!DeepSeek R1:最强开源模型,剑指OpenAI!

国产AI雄起!DeepSeek R1:最强开源模型,剑指OpenAI! 鳌峻睿敏
2025-01-25
1

大家好,今天给大家介绍一款最近火爆全网的模型——DeepSeek R1!它是由国内量化巨头幻方量化倾力打造的,一经发布就引起了AI圈的巨大震动。

说到幻方,大家可能对它在大A股市场的“收割”印象深刻(手动狗头)。但不得不承认,人家在AI领域的实力也是杠杠的!前段时间,幻方仅用557万美元、2000块GPU,就训练出了一个6700亿参数的超大模型,这效率简直逆天!要知道,川普最近还宣布要投入5000亿美元建设AI基础设施“星际之门”,由软银、OpenAI和甲骨文三大巨头领衔,规模堪比当年的“曼哈顿计划”。可见,美国在高科技领域的投入是何等豪横。

但有了DeepSeek这样的模型,我们底气更足了!现在的AI军备竞赛,本质上是算力与能源的比拼,这个比值越高,就代表在AI领域越先进、越有竞争力。虽然美国的电价(约9毛人民币)比中国商业电价(6毛多)贵,但我们在算力方面和他们还有一定差距。而DeepSeek的出现,恰好弥补了这一短板!

DeepSeek采用的是混合专家模式,简单来说,就是把数学、医学等各领域的“专家”请到一个会议室,针对一个问题进行“会诊”。这种模式可以用极小的硬件规模,达到极高的效率。我们完全可以把省下来的钱补贴给硬件企业,再加上我们在能源方面的优势,国产AI的发展就能驶入快车道,真正具备和美国掰手腕的实力!

DeepSeek R1到底有多牛?

DeepSeek的官方微信公众号“深度求索”最近发布了最新模型DeepSeek R1,它有以下三大亮点,绝对让你直呼过瘾!

1. 超级开放!

R1遵循MIT协议,允许用户通过蒸馏技术,借助R1训练其他模型。这和OpenAI的闭源模式形成了鲜明对比!DeepSeek的开放程度,堪称开源领域最宽松的协议之一,意味着每个人、每个单位都可以自由使用这个模型!更良心的是,它还发布了一系列蒸馏模型,从1.5B到70B,各种大小任君选择!

在性能上,1.5B模型在多项数据上已经碾压了GPT-3.5、GPT-4和Claude 3.5!由于资源占用极小,甚至能在最新的手机上流畅运行!而32B和70B的模型,在多项能力上实现了对标O1 mini的效果,表现非常抢眼!这不仅是性能上的对标,更是性价比的碾压!R1每百万token输出的成本仅为O1的1/30!性能相近,价格却是天壤之别,各位老板会怎么选,不用我多说了吧?

2. 深度思考!

R1对用户开放思维链的输出,能让你亲眼见证AI的思考过程!它会不断地假设、证明、证伪,再假设再证伪,直至得出正确的答案,并且还能进行验算!在实际测试中,R1展现出了强大的推理能力,无论是数学题、化学题还是密码题,都能给出准确的答案。这种思维链输出功能,比很多闭源模型要透明得多,更方便我们研究和使用AI!

3. 官网&APP同步上线!

DeepSeek的官网和APP已经同步上线,方便大家第一时间体验这款强大的模型!

实战测试,实力说话!

光说不练假把式,我们直接上干货!我用几道经典的奥数题、脑筋急转弯题和逻辑题对DeepSeek R1进行了测试,结果简直惊艳!

  • **奥数题:**轻松拿下,答案准确,推理过程清晰,完全是学生做题的思路!

  • **脑筋急转弯:**各种刁钻的问题都能对答如流,甚至还能解释其中的逻辑,简直太聪明了!

  • **爱因斯坦的斑马谜题:**R1竟然列出了表格,一步步推导出正确答案,逻辑缜密,令人叹服!

毫不夸张地说,我愿称DeepSeek R1是目前最强的开源模型!如果OpenAI继续保持闭源状态,很快就会被这种开源模型超越,失去头部优势!

DeepSeek的发布极具诚意,直接公开了模型和技术文档,不像OpenAI那样搞各种访谈、圆桌会,营造神秘感。幻方能做出这样的模型,我一点都不意外,毕竟人家公司聚集了一大批数学家、密码学家、金融学家等各领域专家,天生就具备训练大模型的人才和算力基础!

让我们一起期待下一个DeepSeek,期待一个全面超越OpenAI的开源模型的发布!国产AI,未来可期!


【声明】内容源于网络
0
0
鳌峻睿敏
风起于青萍之末 浪成于微澜之间
内容 5
粉丝 0
鳌峻睿敏 风起于青萍之末 浪成于微澜之间
总阅读3
粉丝0
内容5