
百度是全球为数不多的、进行全栈布局的Al公司。从昆仑芯到中国最大的人工智能操作系统“飞桨”,再到千亿参数的“文心大模型”,百度在Al的各个层面都有关键自研技术,这就保证了可以实现端到端的优化。这种“云智一体”的布局可以大幅降低使用Al的成本、提升Al应用的实际效果。
目录
01. 核心业务介绍

核心业务介绍
百度于2000年成立,作为一项搜索引擎业务,以技术可以改变人们发现及消费信息方式的信念建立。百度搜索的核心是更好地理解用户的搜索查询并通过匹配排名搜索结果中最相关的信息来回答该等查询的能力。为此,百度持续创新及开发新技术及产品以改善百度搜索用户体验。自成立开始,百度就使用AI等技术以更好地将用户的搜索意图与海量互联网信息匹配。例如,公司的自然语言处理(一种AI能力)有助于理解查询的重要细节,尤其是复杂的对话查询,这有助于优化返回的搜索结果并提高用户满意度。
百度多年运用AI对互联网上文字,图像及视频等各种形式内容进行分类,理解及智能化处理的经验,帮助其开发出了百度大脑,使百度能进一步发展先进的AI技术,并通过向客户,企业及公共部门提供产品及服务实现商业化。作为领先的互联网平台,获得的持续收入令其能不断加大研发投入。
1.1 百度AI

-
2022年12月27日,百度智能云发布国内首个全栈自研的AI基础设施 “Al大底座”,面向企业Al开发和应用提供端到端自主可控、自我进化的解决方案。(百度AI大底座是源自百度多年产业深度实践积累的全要素智算基础设施;它涵盖了百度昆仑芯,飞桨AI框架以及文心大模型等核心能力以及百舸平台,AI中台等平台方案,将百度的基础架构IaaS与应用平台PaaS能力深度耦合,以全要素、端到端的整合百度的AI优势,为产业提供最强的智能计算基础设施支持,满足产业对于低门槛、快速部署等智能计算需求。因此百度AI大底座涵盖了文心大模型的能力。) -
通过复用标准化解决方案以及从低利润率项目中转移,百度智能云利润率持续优化。

百度智能云大模型平台根据不同企业及开发者需求,提供公有云服务、私有化部署两大服务模式。在公有云服务方面,百度智能云大模型平台将提供:推理(直接调用大模型的推理能力)、微调(通过高质量精标业务数据,高效训练出特定行业的大模型)、托管(将模型发布在百度智能云,以实现更加稳定高效的运行)三种服务,大幅降低企业部署大模型的门槛。根据美国国际研究中心的2022年上半年中国公有云市场报告,百度连续第四年再次名列AI云服务第一名。
在私有化部署方面,支持软件授权(提供在企业环境中运行的大模型服务)、软硬一体(提供整套大模型服务及对应的硬件基础设施)两种方式。私有化部属能够满足对数据监管有严格要求的企业客户需求。

◎ 飞桨
飞桨(PaddlePaddle)是集深度学习核心框架、工具组件和服务平台为一体的技术先进、功能完备的开源深度学习平台,已被国内企业广泛使用,深度契合企业应用需求,拥有活跃的开发者社区生态。提供丰富的官方支持模型集合,并推出全类型的高性能部署和集成方案供开发者使用。


昆仑芯2代AI芯片基于自研架构昆仑芯XPU-R而设计。相比1代产品,2代AI芯片主要为数据中心高性能计算提供算力,支持自然语言处理、计算机视觉、语音以及传统机器学习等各类人工智能任务。
◎ 文心一言-文心大模型
受益于百度知识图谱文心大模型成为了全球首个知识增强千亿大模型。文心大模型已历经多次迭代,在更早之前也已经从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能。
百度为推进大模型深入产业落地,与行业头部企业联合研发融合行业数据、知识以及专家经验的行业大模型,目前百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。

-
生成应用和布局:根据用户的需求和偏好,自动生成各种应用和界面布局,比如网页、APP、游戏等。 -
搜索和数据分析:根据用户的查询,自动搜索和分析相关的数据,并以图表或文本的形式呈现给用户,比如股票、天气、新闻等。 -
程序生成和分析:根据用户的描述或示例,自动生成或修改相应的代码,并对代码进行检查和优化,比如Python、Java、C++等。 -
文本生成:根据用户的输入或主题,自动生成各种类型和风格的文本内容,比如小说、诗歌、广告、论文等。 -
内容创作:根据用户的需求和喜好,自动创作各种类型和形式的内容,比如音乐、视频、图片等。 -
一般推理:根据用户提供的信息或问题,自动进行逻辑推理和判断,并给出合理的答案或建议,比如数学题、谜语、道德问题等。 -
其他:可以应用于其他领域和场景,比如教育、娱乐、社交、医疗等。
1.2 移动生态
1.3 智能驾驶
百度智能驾驶与其他增长计划包括有发展前景及巨大市场机遇的业务,部分业务处于商业化初期,客户群不断增长。百度作为智能驾驶及智能设备领域的市场领导者,正凭借其独特的AI能力,数据洞察力及内部研发芯片寻求快速增长机会。
萝卜快跑提供共享无人车服务,萝卜快跑在国内大陆向十个以上城市的公众开放。2022年,萝卜快跑供应的无人驾驶出行服务订单超过1.5百万单。到2023年1月底,萝卜快跑累计向大众提供的无人驾驶出行服务订单超过2百万单。自2021年11月25日起,萝卜快跑已开始在北京的开放道路上开始收费运营,于2022年7月20日,萝卜快跑获得了在开放道路上就提供无人车服务(方向盘后面无安全人员)收费的许可。2022年12月30日,萝卜快跑首批获准在北京开展全无人自动驾驶测试,令百度在首都的公共道路上向公众提供无人车服务更近一步。

业绩概览


从2021-2022年各季度数据来看,百度2022年第四季度营收为331亿元,基本与2021年同期持平,较第三季度的325.4亿元增长2%。


• 百度Q4净利50亿,较上年同期大幅改善 •

2.1 利润增加的主要原因是降本增效与精简运营
2022财年百度公司收入成本为639亿元,同比上一财年同期的643亿元,该项成本下降1%。销售、一般与行政成本2022财年为205亿元,同比下降17%,财报称该项下降是由于渠道支出、促销营销和人员相关费用的减少。
财报显示,得益于持续的降本增效、精简运营,2022年下半年,百度核心经营利润(非美国通用会计准则)同比增长14%;在新冠疫情冲击宏观经济的第四季度,百度经营利润、经营利润率也均实现同比增长。
2.2 基本盘广告业务收入有所下滑,搜索市场份额依旧遥遥领先
财报中显示,搜索引擎广告的在线营销收入有波动,在四个季度中,分别占总营收的55.3%、57.7%、57.5%、56.2%;核心业务中移动生态依然贡献了大部分营收。2022年,百度核心营收为954亿元人民币。其中,在线广告营销收入为695亿元人民币,同比下降6%。
由于疫情反复影响了线下经济活动,广告主削减预算,百度来自广告的收入减少。财报中显示,活跃在线营销客户数由2021年的约53.5万名减至2022年的约52万名,而每名客户平均收入由2021年的约人民币13.8万元减至2022年的约人民币13.4万元。根据《2022年中国互联网广告数据报告》,2022年,中国互联网广告市场规模预计约为5088亿元,较2021年下降6.38%。
随着2022年12月防疫政策放开后,移动业务的增长让百度广告业务有了回春的迹象。李彦宏的内部信提及,2022年12 月,百度App月活用户数达到6.48亿,同比增长4%。财报数据显示,百度托管页(Managed Page)的收入占广告收入的48%,同比增长了约40%。
2022年,百度在搜索市场的份额依然遥遥领先,且APP月活跃用户指标保持了正增长。根据statcounter统计数据,百度去年仍以超过85%的超高份额位居中国移动搜索市场份额位居榜首。而截至年末,百度APP月活跃用户达到6.48亿,同比增长4%。
「百度在新发布的2023年一季度财报中披露,百度智能云首次实现了盈利」
2.3 非在线营销收入整体营收增长迅速,主要由智能云、AI业务推动
2022年,百度核心营收中,非在线营销收入259亿元,同比增长22%,占该年度总营收的21%。代表着智能云及其他AI业务的非在线营销收入呈总体上升趋势,在四个季度中,分别占总营收的20.07%、20.6%、20%、23%。
同时财报显示,2022年百度核心研发费用达到214.16亿元,占百度核心收入的22.4%。其中Al业务是重中之重。
一方面,作为百度AI to B业务的承载者,百度智能云通过对行业特定痛点的理解,提供深入核心场景的标准化AI解决方案,实现了市场份额的领先。“云智一体” 战略体现出更强竞年力百度智能云已连续四年AI公有云市场第一,2022年上半年在Al公有云服务市场份额占比28.1%。
另一方面,百度自动驾驶业务稳步推进。自动驾驶开放平台Apollo正式推出全新升级版本8.0;自动驾驶出行服务平台萝卜快跑订单量同比大增162%,截至2023年1月底,萝卜快跑累计订单量超过200万单,稳居全球最大的自动驾驶出行服务提供商。
2.4 百度在卸下包袱,而文心一言则是国内最有可能复刻ChaGPT的产品之一
对于百度来说,文心一言发布后,能够直接应用于自身产品的使用中,提升产品力。百度的搜索业务、智能驾驶业务都将受到加持,百度智能云也接入文心一言,提升B端服务能力。除此之外智能语音、数字人等都将通过文心言获得新的可能。

AIGC角度市场分析
3.1 大模型成为AI领域基础设施
而在国内,百度、阿里、华为、腾讯等公司也已在浪潮赶来之前就有所布局:

• 百度与阿里对比 •
百度文心大模型:包含NLP大模型、CV大模型、跨模态大模型、生物计算大模型、行业大模型等。与Bing类似,文心一言有望优化C端用户搜索、创作体验;ToB方面,百度已开放大模型API接口,在文案、AI作画、开放域对话方面赋能企业。对于具体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。
阿里巴巴通义大模型:由通义-M6模型融合语言模型和视觉模型组成,率先应用在硬件终端天猫精灵和软件通义千问。通义大模型包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。在应用上,天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟”;对话式通义千问已经开始内测。
作为国内大模型训练规模最大的两家巨头,百度的文心大模型与阿里的通义千问形成对标,基于当前的发展也积累出了一些对比:
-
C端功能势均力敌,B端服务能力阿里更具优势
-
百度文心一言的核心优势是对中文的理解
3.2 大模型背后的算力之争
人工智能的基础层是数据和算力,数据由服务器和光模块存储和运输;算力由CPU、GPU、FPGA、ASIC等芯片支撑。
根据前瞻产业研究院的数据,未来几年内,中国人工智能芯片市场规模将保持年均40%至50%的增长速度,到2024年,市场规模将达到785亿元。
数字经济时代,算力无处不在。以芯片、服务器、云计算提供商为主的市场主体,共同构成算力产业的大图景。
中国算力产业正在进入新一轮发展周期,有两个变量将影响中国企业的全球竞争力。第一个变量是2022年全面启动的“东数西算”政策,目的是让算力像水电一样便宜简单易用,同时希望中国企业在国际产业链占据主动权。第二个变量是AI让智能算力需求爆发,智能计算正在重塑云、软件、芯片产业,还在影响其他产业的智能化转型。
中国拥有算力资源的两大主力军分别是国资背景的三大电信运营商(中国移动、中国电信、中国联通)、民营背景的几大科技公司(阿里、腾讯、华为、百度),两大主力军背后,是一条包括设备服务商、芯片供应商、芯片制造商的庞大算力产业链。如果力量分散且失衡,中国算力产业会在关键时刻被拉开差距。

◎ AI模型数据规模增长,AI算力需求井喷
当前算力距离AI应用存巨大鸿沟。根据Open AI数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。英特尔表示,目前的计算、存储和网络基础设施远不足以实现元宇宙愿景,而要想实现真正的元宇宙,目前的计算能力需量要再提高1000倍。


大模型借助“预训练+精调”等模式,用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水平完成细分应用的任务。
企业由此借助AIGC技术提高生产效率,降低生产成本,利好下游垂类应用企业,目前AI应用领域:家居、金融、医疗、安防、交通、零售等;
伴随着ChatGPT的出现,带来的文本生成、代码生成、图像生成等能力将有效赋能至下游,减少人工成本,提高办公效率,有效助力企业降本增效;目前国内大厂加快多模态大模型的研发落地,并与众多企业合作,下游应用场景将不断拓展,未来人工智能具备广阔的市场空间。

未来发展展望
• 优异成绩令市场瞩目,各大机构纷纷上调了业绩预测 •
目前,已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的400多家头部企业宣布加入百度“文心一言”生态。随着文心一言等通用AI产品的技术迭代和成本降低,未来百度智能云将突破更多核心场景。

