之前在Twitter上,马斯克问OpenAI的首席执行官 Sam Altman关于ChatGPT每一次聊天的平均成本,Altman回应是"single-digit cents per chat.”。
市调机构帮Google算了算导入LLM背后的经济账,如果Google每秒大约有320k个搜索查询(search query),2022带来了1620亿美元营收,每个搜索查询等于 1.61 美分的收入。 Google搜寻的营业利益率是34.15%,所以每个query的成本大概是 1.06 美分,如果加上ChatGPT的成本,等于会让Google每一个搜索查询成本倍增。重要的是,搜寻原本就是Google的最核心最赚钱的业务,微软这一招直指Google要害,让搜寻成本倍增,搞不好会变成赔钱生意。
那微软引入ChatGPT不同样是让Bing的搜寻成本增加?意义不太一样,因为微软的Bing全球搜寻的占有率很低,估计只有3%,就算是将ChatGPT整合进搜寻技术也不会花太多钱。但Google市占率超过90%,一旦把昂贵的大型语言模型LLM加入搜寻当中,会拖垮Google的利润。
显见微软的战术是,是花了一点点小钱就把Google的搜寻业务金鸡母给宰了,这一招实在太高!
不过,专家也分析,LLM成本十分高昂,未来真正想由LLM驱动搜索来取代传统搜寻,LLM的成本至少要降低十倍。但是只要大型企业在前期愿意投资,未来都可以逐年获得回报,且高质量数据将来可成为训练LLM的新兴稀缺资源之一。
ChatGPT也让原本沉寂的AI芯片领域再度活络起来,因为背后的硬体推手是云端服务器,目前英伟达的GPU是AWS最佳解决方案,ChatGPT爆红的最大芯片受益者明显是英伟达。
2022年底,微软的Azure 也宣布和英伟达合作,结合 Azure 先进超级计算基础设施和英伟达GPU、网路技术和完整的 AI 软件堆叠支援打造 AI 超级电脑,并进一步加快推动生成式 AI(generative AI)进展。
双方也合作将微软的 DeepSpeed 深度学习最佳化软件调整到最佳状态。微软的 DeepSpeed 将利用 NVIDIA H100 Transformer 引擎加快执行采用 Transformer 模型的速度,用在大型语言模型、生成式 AI 和电脑程式码编写等广泛应用。这项技术将 8 位元浮点精度功能用于 DeepSpeed,以大幅加快采用 Transformer 模型的 AI 运算速度,传输量是 16 位元运算的两倍。
ChatGPT反映的是探索新技术的巨大创新能量,没有大家最常听到的政府补贴加持等,仅是倚靠自由市场的力量与就起飞,成为这一波矽谷创新浪潮中幸运脱颖而出的新创公司。但这样说或许太过轻巧,毕竟OpenAI从来都不是一家“素人”新创公司,其创始阵容各个是大有来头系,不凡的家世背景注定横空出世的这天。
这次微软压宝OpenAI的成功带给Google很大压力,未来Google不但要加快AI技术发展速度,更要朝“更准确的聊天结果”来强化,才有机会打赢这场仗,不然见证一个科技巨人的倒下并不遥远。
这场可能是AI大举进入人类生活的最重要战役中,Google、微软,或是其他新创公司、巨头企业谁会是最后的大赢家未有答案,但可以确定的是,为这场举世轰动的AI大赛提供充足GPU“军力”的英伟达又再度大获全胜。

