SIICFM Insights | 关于大语言模型的几个事实和猜想- 大数跨境

上实资本科技基金

2023-11-01

随着ChatGPT在去年下半年的爆火，资本市场的热情被引燃。一级市场方面，继2015年的千团大战之后，2023年出现了百模大战；二级市场不甘落后，英伟达从2022年10月13日的每股108.06美元最高上涨至2023年8月24日的每股502.62美元，不到一年上涨近5倍，A股市场人工智能、AI芯片、光模块等上涨4-5倍的概念股也比比皆是。

大语言模型商业化到底如何，随着上市公司财报、初创企业融资等公开信息的披露，笔者观察到几个行业事实：

英伟达是当之无愧的最大赢家。根据英伟达8月份发布的截止7月30日的2024财年第二财季的财报，得益于微软、谷歌、亚马逊以及中国的BBAT（百度，字节跳动，阿里，腾讯）纷纷采购用于生成式AI的H100/A100/H800/A800服务器，数据中心业务营收103.2亿美元，同比增长171%，环比增长141%，二季度比一季度翻倍还要多，而结束于2023年1月29日的2023财年，数据中心业务营收仅150.1亿美元。

OpenAI CEO Sam Altman最近对员工透露，2023年年化收入达13亿美元，是去年2800万美元的46倍，而在年初，OpenAI曾估计，2023年来自付费订阅、购买API访问权限等的收入约2亿美元。

华尔街日报宣称Github Copilot赔钱，目前订阅费是10美元/月，而微软花在单个用户身上的平均成本超过30美元，对此，Github CEO Nat Friedman在推特上回应：“Less than the price！” 。

百度、阿里、华为、腾讯纷纷涉足大语言模型，并且多数由云计算部门主导，商业模式大多两条腿走路，一是通过提供MaaS（Model as a Service），获取平台服务费用，二是通过出租算力和推理、训练平台，赚取大模型企业的租金。

从已披露的Q2财报来看，大模型并未成为驱动增长的力量。百度Q2智能云营收45亿元，同比增长5%，而Q1智能云营收42亿元，同比增长8%，智能云业务增速下滑。腾讯Q2金融科技及企业服务业务收入486亿元，同比增长15%，其中隶属于企业服务的云服务业务仅轻微增长。阿里云Q2营收251.23亿元，同比增长4%，Q1营收185.82亿元，同比下降2%，Q2算是扭转颓势。

据智东西统计，2023年上半年全球AIGC融资事件51起，融资金额超过1000亿元人民币，其中包括OpenAI 103亿美元（约人民币745亿元）的B+轮融资，投后估值270-290亿美元。而2022年全年，AIGC赛道共计78笔融资，融资金额13.7亿美元，约合人民币96亿元。

国内大模型创业企业中，今年6月，MiniMax宣布完成2.5亿美元新一轮融资，估值达到独角兽级别；王小川创办的百川智能近期完成3亿美元A1轮融资，加上5000万美元的天使轮融资，共计融资3.5亿美元；10月20日，智谱AI宣布今年累计获得融资25亿元人民币，股东包括社保基金中关村自主创新基金以及美团、蚂蚁、阿里、腾讯、小米等互联网大厂。

大语言模型非常消耗算力，OpenAI三年前接受了微软为其打造的一台由数万个A100 GPU组成、价值数亿美元的大型AI超级计算机，据推测标准大小的ChatGPT-175B大概需要625台8卡DGX A100服务器进行训练，成本约达到3~5亿元人民币。此外，大模型训练极度依赖高质量语料数据，微软不仅为OpenAI提供了算力，还提供了海量数据。

2023年10月17日，美国商务部下属工业安全局BIS升级对华芯片出口限制，超过特定性能阈值的产品出口到中国大陆、中国香港、俄罗斯等特定国家/地区需要获得许可，包括但不限于英伟达A100、A800、H100、H800、L40、L40S以及RTX4090等，同时，壁仞科技及其子公司、摩尔线程及其子公司被列入实体清单。

结合上述事实，关于中国大语言模型的发展，笔者有如下猜想：

美国升级对华芯片出口限制是影响AIGC赛道发展的关键，客观上有利于BBAT等大厂。H100、A100是目前英伟达最先进的GPU芯片，在此次禁令前，已不能出口中国，所以英伟达做了阉割版的H800、A800供应中国，之前有报道称，BBAT四家大厂向英伟达下了50亿美元订单，英伟达今年将发货10万片A800，价值10亿美元，其余芯片2024年才能交付。

中国算力突围的关键在华为。针对此次禁令，英伟达CEO黄仁勋直言中国也有不少好的科技厂商，比如华为，英伟达必须与当地产业竞争。而此前科大讯飞董事长刘庆峰公开表示，华为昇腾910B性能基本可以对标A100。

华为突围的关键在半导体装备产业链。H100采用台积电4nm工艺，A100采用台积电7nm工艺，华为芯片设计能力毋庸置疑，但如何生产出来，要靠国产半导体装备产业链的支持，其中最关键的是光刻机。

除了算力外，高质量语料方面，目前百度具有一定的优势，因为搜索天然需要整合各类知识，而阿里、腾讯、字节以及华为的数据都有些偏科。这也是为什么百度可以做到最先发布文心一言大语言模型，并已推出相关C端产品，以及李彦宏最近表示，百度所有产品都要基于大模型重做一遍。

创业企业面临巨头强大的压力，不管是在算力上，还是高质量数据上，创业企业都不占优势，也基本没有做出数亿用户的C端产品的可能，探索出一条大模型低成本落地千行百业的路径，可能是创业企业突围的方向之一，比如采用“大模型预训练+精调”的模式，利用大模型超强的泛化能力学习客户自己的小样本数据，做出满足客户独特需求的模型。

AI开源社区顶流Hugging Face，在现有大模型上微调，为客户提供构建、训练和部署机器学习模型的工具，而不是从头开始训练大模型，Hugging Face最近一年估值翻倍，达45亿美元。

免责声明：本报告仅代表作者个人研究观点，不代表所在公司观点及投资建议；报告内容所引用内容版权归原作者所有，如有侵权，请联系删除。

【声明】内容源于网络

上实资本科技基金

创新绿色未来

内容 747

粉丝 0

上实资本科技基金创新绿色未来

总阅读1.8k

粉丝0

内容747