
随着ChatGPT在去年下半年的爆火,资本市场的热情被引燃。一级市场方面,继2015年的千团大战之后,2023年出现了百模大战;二级市场不甘落后,英伟达从2022年10月13日的每股108.06美元最高上涨至2023年8月24日的每股502.62美元,不到一年上涨近5倍,A股市场人工智能、AI芯片、光模块等上涨4-5倍的概念股也比比皆是。
大语言模型商业化到底如何,随着上市公司财报、初创企业融资等公开信息的披露,笔者观察到几个行业事实:
01
英伟达是当之无愧的最大赢家。根据英伟达8月份发布的截止7月30日的2024财年第二财季的财报,得益于微软、谷歌、亚马逊以及中国的BBAT(百度,字节跳动,阿里,腾讯)纷纷采购用于生成式AI的H100/A100/H800/A800服务器,数据中心业务营收103.2亿美元,同比增长171%,环比增长141%,二季度比一季度翻倍还要多,而结束于2023年1月29日的2023财年,数据中心业务营收仅150.1亿美元。
02
OpenAI CEO Sam Altman最近对员工透露,2023年年化收入达13亿美元,是去年2800万美元的46倍,而在年初,OpenAI曾估计,2023年来自付费订阅、购买API访问权限等的收入约2亿美元。
03
华尔街日报宣称Github Copilot赔钱,目前订阅费是10美元/月,而微软花在单个用户身上的平均成本超过30美元,对此,Github CEO Nat Friedman在推特上回应:“Less than the price!” 。
04
百度、阿里、华为、腾讯纷纷涉足大语言模型,并且多数由云计算部门主导,商业模式大多两条腿走路,一是通过提供MaaS(Model as a Service),获取平台服务费用,二是通过出租算力和推理、训练平台,赚取大模型企业的租金。
从已披露的Q2财报来看,大模型并未成为驱动增长的力量。百度Q2智能云营收45亿元,同比增长5%,而Q1智能云营收42亿元,同比增长8%,智能云业务增速下滑。腾讯Q2金融科技及企业服务业务收入486亿元,同比增长15%,其中隶属于企业服务的云服务业务仅轻微增长。阿里云Q2营收251.23亿元,同比增长4%,Q1营收185.82亿元,同比下降2%,Q2算是扭转颓势。
05
据智东西统计,2023年上半年全球AIGC融资事件51起,融资金额超过1000亿元人民币,其中包括OpenAI 103亿美元(约人民币745亿元)的B+轮融资,投后估值270-290亿美元。而2022年全年,AIGC赛道共计78笔融资,融资金额13.7亿美元,约合人民币96亿元。
06
国内大模型创业企业中,今年6月,MiniMax宣布完成2.5亿美元新一轮融资,估值达到独角兽级别;王小川创办的百川智能近期完成3亿美元A1轮融资,加上5000万美元的天使轮融资,共计融资3.5亿美元;10月20日,智谱AI宣布今年累计获得融资25亿元人民币,股东包括社保基金中关村自主创新基金以及美团、蚂蚁、阿里、腾讯、小米等互联网大厂。
大语言模型非常消耗算力,OpenAI三年前接受了微软为其打造的一台由数万个A100 GPU组成、价值数亿美元的大型AI超级计算机,据推测标准大小的ChatGPT-175B大概需要625台8卡DGX A100服务器进行训练,成本约达到3~5亿元人民币。此外,大模型训练极度依赖高质量语料数据,微软不仅为OpenAI提供了算力,还提供了海量数据。
2023年10月17日,美国商务部下属工业安全局BIS升级对华芯片出口限制,超过特定性能阈值的产品出口到中国大陆、中国香港、俄罗斯等特定国家/地区需要获得许可,包括但不限于英伟达A100、A800、H100、H800、L40、L40S以及RTX4090等,同时,壁仞科技及其子公司、摩尔线程及其子公司被列入实体清单。
结合上述事实,关于中国大语言模型的发展,笔者有如下猜想:
01
美国升级对华芯片出口限制是影响AIGC赛道发展的关键,客观上有利于BBAT等大厂。H100、A100是目前英伟达最先进的GPU芯片,在此次禁令前,已不能出口中国,所以英伟达做了阉割版的H800、A800供应中国,之前有报道称,BBAT四家大厂向英伟达下了50亿美元订单,英伟达今年将发货10万片A800,价值10亿美元,其余芯片2024年才能交付。
02
中国算力突围的关键在华为。针对此次禁令,英伟达CEO黄仁勋直言中国也有不少好的科技厂商,比如华为,英伟达必须与当地产业竞争。而此前科大讯飞董事长刘庆峰公开表示,华为昇腾910B性能基本可以对标A100。
03
华为突围的关键在半导体装备产业链。H100采用台积电4nm工艺,A100采用台积电7nm工艺,华为芯片设计能力毋庸置疑,但如何生产出来,要靠国产半导体装备产业链的支持,其中最关键的是光刻机。
04
除了算力外,高质量语料方面,目前百度具有一定的优势,因为搜索天然需要整合各类知识,而阿里、腾讯、字节以及华为的数据都有些偏科。这也是为什么百度可以做到最先发布文心一言大语言模型,并已推出相关C端产品,以及李彦宏最近表示,百度所有产品都要基于大模型重做一遍。
05
创业企业面临巨头强大的压力,不管是在算力上,还是高质量数据上,创业企业都不占优势,也基本没有做出数亿用户的C端产品的可能,探索出一条大模型低成本落地千行百业的路径,可能是创业企业突围的方向之一,比如采用“大模型预训练+精调”的模式,利用大模型超强的泛化能力学习客户自己的小样本数据,做出满足客户独特需求的模型。
AI开源社区顶流Hugging Face,在现有大模型上微调,为客户提供构建、训练和部署机器学习模型的工具,而不是从头开始训练大模型,Hugging Face最近一年估值翻倍,达45亿美元。
免责声明:本报告仅代表作者个人研究观点,不代表所在公司观点及投资建议;报告内容所引用内容版权归原作者所有,如有侵权,请联系删除。

