大数跨境

DeepSeek创始人梁文峰的故事 |经济学人

DeepSeek创始人梁文峰的故事 |经济学人 领导者管理笔记
2025-02-17
2

领导者管理笔记

消息微信公众号又改版了即便我每天都按时发文,你也可能收不到信,甚至可能永久失联。唯一的办法就是把“领导者管理笔记”公号设置星标☆,这样才能每天照常收到文章加(微信:New-leaders)进管理交流群

加(微信:FireFuryFree)进《领导者管理笔记》管理群



Business | Flying high

DeepSeek poses a challenge to Beijing as much as to Silicon Valley

Jan 29th 2025 | The story of Liang Wenfeng, the model-maker’s mysterious founder


随着其最新人工智能(AI)模型DeepSeek的发布,一家鲜为人知的中国公司彻底破坏了美国多年来旨在遏制中国创新的政策——在此过程中,也严重冲击了从美国AI芯片冠军英伟达(Nvidia)到西门子能源(Siemens Energy,一家为数据中心制造电气设备的公司)等公司的估值。DeepSeek展示了其绕过美国出口限制进行创新的能力,这引发了人们对于获取大量尖端半导体及相关设备在训练AI模型时是否如之前所认为的那样重要这一疑问


这一切的中心人物是DeepSeek 40岁的创始人梁文峰。目前尚不清楚他对自己引发的全球市场动荡有多大程度的享受。一位最近接受当地媒体采访的高中同学表示,梁先生在1月29日开始的农历新年期间躲在家乡。


梁先生因其瘦削、苍白的外貌在中国社交媒体上被戏谑,对大多数人来说仍是个谜。那些与DeepSeek有过职业往来的人表示,他对类似人类的人工通用智能(AGI)及其对世界可能产生的影响非常着迷。


在追求这一目标的过程中,DeepSeek的创始人正在颠覆西方和中国关于技术进步的理念。


关于梁先生的公开信息很少。他1985年出生在一个靠近南方城市湛江的贫困村庄的教师家庭,是一名天赋异禀的学生。一位前教师声称他在中学时就掌握了大学水平的数学。2002年,他考入了位于东部城市杭州的知名学府浙江大学,攻读电子信息专业。在同一位著名的机器视觉科学家指导下,他在该校攻读硕士学位,从而接触到了人工智能领域。


当时,杭州是一个互联网技术的繁华中心,也是阿里巴巴等新兴公司(如电商公司阿里巴巴)的所在地。梁先生和几位同学留在了这座城市,开始尝试量化投资模型,这种模型不依赖于公司基本面,而是依赖于处理大量数据。


2013年,梁先生和三位同学成立了一个名为雅克比(Yakebi)的投资集团,试图将其建立的交易模型商业化。

两年后,梁先生联合创立了幻方量化,一家量化对冲基金,在中国放松管制和市场波动期间,与数十家类似公司一起迅速发展。2021年,该公司声称管理的资金高达1000亿元人民币(140亿美元)。业内人士表示,幻方量化因其激进的策略经常引起证券监管机构的不满。


DeepSeek的起源在于改进幻方量化的算法。


2019年,该公司投资2亿元人民币成立了一个独立部门,开发自己的深度学习平台,名为“Fire-Flyer 1”。


2021年,该基金又投入10亿元人民币,推出了第二代产品,配备了10,000个英伟达A100图形处理单元。这使得幻方量化成为一个特例:当时中国只有四家公司拥有如此庞大的高端芯片库,且均为阿里巴巴等科技巨头。


直到2023年,DeepSeek才正式从幻方量化中独立出来,成为一家独立运作的公司。


去年5月,DeepSeek首次对市场产生了重大冲击,当时它推出了一款基于其V2模型的超便宜聊天机器人。这引发了中国AI行业的价格战,迫使该国最大的科技公司——阿里巴巴、百度、字节跳动和腾讯——降低自己的价格


据梁先生本人所说,这并不是为了吸引更多用户。他在7月表示,随着DeepSeek探索新的模型结构,成本已经下降,这使其与其他公司区分开来。尽管中国的竞争对手AI公司也在进行自己的模型研究,但由于美国的出口限制,它们在计算能力上的劣势导致它们更多地专注于创建使用该技术的智能应用程序。许多中国AI公司以Meta(一家美国社交媒体公司)开发的大型语言模型家族Llama为基础构建了自己的应用程序。


对梁先生来说,开发使用更少计算能力的模型是实现其长期目标的关键一步。“我们的目标是AGI,这需要我们在有限的资源内探索新的模型结构,以实现卓越的能力”他告诉当地媒体。


DeepSeek的新R1模型震惊了西方,表明该公司正在取得进展。该公司表示,训练R1的成本不到600万美元,仅为OpenAIChatGPT的制造商)等公司的类似模型成本的一小部分。


OpenAI的老板萨姆·奥特曼(Sam Altman)称R1“令人印象深刻”(尽管他也承诺将推出“更好的模型”,并补充说“有一个新的竞争对手是令人振奋的”)。


DeepSeek当然也有其怀疑者。早期测试似乎证实R1确实如其制造商所说的一样强大。但有些人质疑该公司是否低估了开发该模型所使用的高端芯片数量,尽管其他人认为其说法是可信的。还有猜测称DeepSeek通过研究美国模型的结果来训练其模型,这一过程被称为“蒸馏”。


即使DeepSeek的效率提升不如预期那样令人印象深刻,它们仍然对硅谷和北京的思维构成了挑战。中国媒体迅速将DeepSeek捧为该国在AI霸权斗争中的国家资产。1月20日,梁先生与其他几位企业家一起受邀会见了总理。

梁先生认为,在过去的30年里,中国在技术上一直是一个“追随者”,建立在西方开发的基础上。他7月在接受当地媒体采访时表示,美国和中国之间的差距在于“原创与模仿”。他认为,英伟达的成功不仅依赖于其自身的性能,还依赖于西方公司之间的技术合作。尽管中国进行了资本密集型的国家主导努力来创建这种合作,但在他看来,中国在模仿西方计算能力方面的努力因缺乏这种合作而未能成功。DeepSeek的出现算是对硅谷的警钟。


@THE END


应广大粉丝要求,我们建立了一个【领导者管理交流群】,小伙伴们热情踊跃,目前人数已经上万人了,不能直接进群啦,想要进群的添加小编微信,拉你进群。两个添加其一即可!

欢迎加入10W+领导者社群

文章来源 领导者养成笔记「ID:GoToLead 」,转载请公众号回复“转载

版权说明 们尊重原创者版权,除我们确实无法确认作者外,我们都会注明作者和来源。在此向原创者表示感谢。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权立即删除内容;本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。



【声明】内容源于网络
0
0
领导者管理笔记
关注我,与100万领导者一起学组织和管理。张三峯,15年500强高层管理经验,“人人都是领导者“理念推动者,“商业新知”管理十佳创作者,多家公司管理咨询顾问。
内容 7624
粉丝 0
领导者管理笔记 关注我,与100万领导者一起学组织和管理。张三峯,15年500强高层管理经验,“人人都是领导者“理念推动者,“商业新知”管理十佳创作者,多家公司管理咨询顾问。
总阅读210
粉丝0
内容7.6k