大数跨境
0
0

演讲实录 | OB Cloud 2025:一体化多云数据库的现在与新征程

演讲实录 | OB Cloud 2025:一体化多云数据库的现在与新征程 OceanBase
2025-11-21
1
导读:OceanBase 已经为多云和 AI 驱动的时代做好了准备

编者按

11 月 18 日,2025 OceanBase 年度发布会在北京举行。现场,OceanBase CEO 杨冰发布 2025 商业化新进展时表示,公有云(OB Cloud)已成为OceanBase “第二增长曲线”。近三年,OB Cloud 客户数年均增长 115%,营收占比已达 30%。目前,它已稳定运行于阿里云、华为云、腾讯云、百度智能云、AWS、Azure、GCP 七大主流云基础设施,应用无需改造即可“一套架构、全球运行”。这一能力正成为企业高增长的关键支撑,已在零售、金融科技、消费电子和泛互联网行业规模化落地。

在当天下午举办的“云数据库+AI专场”中,OceanBase 公有云产品总监陈小伟带来了以“OB Cloud一体化多云数据库2025新进展”为主题的分享,内容涵盖了过去一年 OB Cloud 在技术架构创新和产品能力提升方面的成果。陈小伟表示,接下来,OB Cloud 将持续提升产品易用性,加快全球化布局,并积极拥抱 AI 浪潮,推出更多切实可行的落地方案。

以下为演讲实录:



各位领导、各位专家老师,大家下午好!我是陈小伟,是 OceanBase 的产品经理,负责 OceanBase 公有云产品。今天我分享的主题是“OB Cloud 一体化多云数据库 2025 新进展”。

本次分享将包括以下四个部分: 


首先,将与大家探讨云数据库领域当前的行业趋势,分析近期发生的新变化以及依然保持不变的核心部分;


第二部分将向大家汇报 OB Cloud 在今年取得的重要成果,其中包含一系列首次公开的数据;


第三部分会介绍支撑这些成果背后的技术架构创新和产品能力的提升;


最后,我会简要展望 2026 年,分享我们认为可能会出现的新动向和挑战


云数据库洞察:数智时代的变与不变


首先,我们来看行业趋势。


以市场角度为切入点,中国信通院每年都会发布数据库发展趋势报告,其内容主要分为三个章节。


第一部分是营收数据。无论全球市场还是中国市场,数据库行业整体仍在持续增长。虽然增速相比往年有所放缓,但如果与 GDP 增长幅度进行对比,可以看到中国数据库行业保持着 10% 以上的增长率,而同期 GDP 增速仅为 5%。



由此可见,数据库行业的发展速度显著高于整体经济体。值得注意的是,随着技术不断革新,单位数据量的处理成本在逐步下降,因此实际数据规模的增长速度远远超过产业营收的增速。

进一步细分营收来源,从公有云和私有云两个类别来看,公有云的增长幅度明显高于私有云,目前增速依然处于 20% 的高位。这背后反映出企业在数字化转型和 AI 数智化进程中,越来越依赖公有云基础设施。


公有云带来了诸多优势,比如更低的成本、更高的敏捷性,同时也更加安全稳定——因为公有云厂商拥有大规模的技术团队保障系统稳定。但这并不代表上了云就可以高枕无忧了,根据现实情况,即便是国内最大的公有云厂商,甚至是全球前三的云服务商,在最近半年也都发生过大规模、持续时间较长的服务故障。这给我们带来一个重要的警示:上云可以带来便利和保障,但真正的安全和稳定并不是如此简单就能实现,还需要更深入的技术和运维能力支撑。


报告的第二部分内容聚焦于 AI。今年,AI 领域持续火热,如果我们从数据角度切入,又有哪些新的趋势?根据 IDC 的最新报告,2023 到 2028 年全球数据仍将保持每年约 30% 的高速增长。


进一步分析数据构成,我们可以将其划分为结构化和非结构化两大类。从目前的报告来看,到 2028 年,非结构化数据将占据高达 82% 的比例,包括图片、视频等多媒体内容,这意味着我们的业务系统面临着前所未有的大规模非结构化数据的处理挑战。


另一个值得关注的现象是,虽然非结构化数据体量庞大,但结构化数据的增速实际上更高——预计每年增长率可达 50%。比如,2023 年结构化数据仅占数据总量的 10%,而到 2028 年将提升到 20%。这种变化背后的核心驱动力就是 AI 的发展。


举个例子,当你发布一条抖音或微信视频号内容时,除了视频文件本身这种非结构化数据,平台还会产生大量的结构化数据,比如用户访问的时间、点赞、评论、分享等互动行为以及一系列分析统计。这说明,AI 的兴起不仅带来了对非结构化数据处理的新需求,同时也极大推动了结构化数据的生成和增长,而且这一需求量更大。


作为数据库厂商,一方面,我们必须积极应对新型工作负载和复杂非结构化数据的挑战,另一方面,仍需持续提升结构化数据的存储与处理能力,确保在面对海量数据与高并发的业务场景时,能够为客户提供高效、可靠的解决方案。这将是未来几年数据库行业持续投入和创新的重点方向。

从友商角度来看,大家在 AI 方向都进行了积极的布局。我这里不做过多展开,但可以明显感受到几乎每一家数据库厂商都在 AI 领域进行了大量投入,不过具体做法各有侧重。有些把模型的托管、训练和推理作为重点,也有一些厂商注重利用 AI 技术提升自身数据库在开发、运维和诊断等环节的易用性和智能化水平。但如果我们深入研究各家在“数据库作为 AI 基础设施”方面的介绍,不难发现,虽然市场宣传很多,但真实的客户案例却仍然比较有限。这也让我有一个观察:AI 确实带来了新的工作负载和需求变化,但数据库作为 AI 基础设施,究竟应为应用层提供哪些最关键的能力这一点,目前行业还没有形成标准答案,大家还在不断探索中。


2025成绩单:全球化多云战略初见成效


分享的第二部分,我将结合具体数据,分享 OceanBase 在过去一年取得的一些成绩,接下来我会以不同的视角向大家进行汇报。


这里我想分享一些具体数字。


首先是实例数量。从去年年底到今年 10 月底,OceanBase 公有云线上实例数量实现了 2 倍以上的增长。对于自 2020 年开始探索商业化、2022年正式发布 OB Cloud 的数据库厂商而言,仅用五年时间,就能够保持 100% 的年增速极为难得。这背后,离不开越来越多客户对我们的认可与信任。


其次,在云厂商支持方面,今年我们新增了两家合作伙伴:国内接入了百度云,国际则支持了 Azure。


同时,从渠道布局的角度看,今年我们还进入了 AWS 中国。大家都知道,部分国际云厂商在中国和在国际运作,使用的是两套完全不同的体系,无论是网络架构还是结算渠道都与国际体系隔离。今年我们一次性落地三个主流云厂商,背后离不开团队高效的研发能力,无论是底层数据库技术,还是中台体系(包括财务、订单、合同等业务流转),都在持续提升。目前,OB Cloud 已稳定运行于阿里云、华为云、腾讯云、百度智能云、AWS、Azure、GCP 七大主流云基础设施。


云厂商的广泛合作,也给 OB Cloud 带来越来越多的开服地域。对于全球用户来说,这意味着可以更便捷地获得 OB Cloud 的服务。很多同行也提到多云布局,但如果仔细比对会发现,大多数只是在一两个云厂商上有完整覆盖,其他云商仅有少数地域试点,这样实际上难以满足客户多地布局的需求。尤其对于有出海需求的中国客户,只有渠道覆盖足够广,才能真正服务到全球各地。


如今,OB Cloud 已支持全球 64 个开服地域,覆盖 240 多个可用区,在覆盖数量上,远超全球最大的云厂商,因此 OB Cloud 已经为客户提供了极为丰富的选择和灵活的部署能力。


再来说说多云战略。简单回顾一下,OB Cloud 最初是在 2020 年推出的——那时 OceanBase 还没有开始商业化运营,产品在阿里云官网渠道首发。随后我们打造了 OB Cloud 的独立站点,正式开始多云布局。最初几年,我们的产品重心还是在阿里云,真正发力多云是在两年前。可以看看最新的一组数据:当前线上生产环境中,已有约 20% 的数据库实例部署在海外地域。今年年初时,90% 的实例还集中在阿里云,如今,阿里云之外的实例占比已提升至 23%。这意味着仅仅一年时间,我们的多云战略就取得了非常显著的成果。


刚才我们分享的是一些宏观的数据,接下来我想结合具体负载,从实际客户如何使用我们的数据库谈一谈。


比如在单节点的存储规模上最高达到 77 个 TB ,线上客户单个集群节点数量最多可达98个,单个实例的数据量已突破 760TB,接近 1PB。实际上,如果考虑数据复制等实际情况,实际存储量还会更高。


当然,这还不是我们的极限——以我们在阿里集团和蚂蚁集团的内部部署为例,最大的一个集群数据规模已经超过 5PB。


在某些高并发分析型场景下,单个租户的数据吞吐量最高可达 40GB/秒。这个数据怎么来的?我们在阿里云上,使用的是阿里云的 CLB 负载均衡,一个 CLB 最大能承载 5GB/秒的数据流量。这个租户实际用了 122个 CLB,才能承担如此高的业务负载压力。


另外还有一个数字——300。我们的最大客户在线上运行着超过300个实例。


这些数字代表什么?其实对于很多数据库厂商来说,很少会公开具体数据,只会强调能支持很大的规模。以我的亲身体验举个例子:我上周跑了全马,虽然练了一年,跑完还是非常累,原因是日常训练最多跑过 30 公里,真正跑全程才知道实际的挑战有多大。但我上个月跑了一次半马,却非常轻松。人体和数据库都是复杂系统,道理也是一样的:理论上能支持大规模、高并发,但只有在真实的生产环境下经受实际负载的检验,才能证明产品实力。


OceanBase 已经在海量数据、高并发的极端场景下,历经严苛考验。从 SQL 优化器、存储事务、网络到 IO 的每一个组件,都经过一线实战的检验,即便在极端环境中,都能稳定可靠。5 公里、10 公里都能轻松完成,面对真正的数据“全马”,OceanBase 也能从容应对。很多厂商宣称能支持大规模,大家不妨对比一下,在真实生产环境下,究竟能扛住多大的负载和数据压力?

再来看 AI,今天有很多嘉宾都在分享“AI-Ready”的理念。我的观点是,目前针对 AI 应用并没有一个统一、标准化的数据架构。许多客户也有类似的反馈:虽然现在他们明确知道要用向量、检索等功能,但对未来的需求并不确定,毕竟 AI 的发展变化十分迅速。因此,客户希望他们的数据库供应商本身就是一家具备“AI-Ready”能力的企业,这样可以确保自己的技术路线始终跟得上时代,不轻易掉队。


正如 IDC 的报告所展示,OceanBase 作为数据基础设施服务商,在 AI 时代已经稳居前列,具备很强的技术引领和创新能力。


再来看新的负载场景。在很多场景中,我们都在强调一体化,宣称可以支持各种类型的负载,但这是否言过其实?是否真的有具体实例?偶尔能举出一两个案例其实并不充分,我们更需要关注整体的占比和实际应用情况。


以去年上半年推出的云上分析型负载 OceanBase v4.3.5LTS 版本为例,截至目前,线上已有约 10% 的实例在承担  OLAP 负载,有 5% 左右的实例在运行 HTAP 负载。早些年 HTAP 概念受到很多关注,也曾被认为是厂商推动的市场概念,而不是实实在在的应用场景。但今天,客户已经在实际生产中用 OceanBase 支撑 HTAP 负载。HTAP 一体化数据库已经不再是一个概念,而是 OceanBase 切实存在、具有一定规模的业务实践。


向量检索也是如此,虽然我们推出相关能力不久,但目前已有约 3% 的线上实例正在使用向量相关功能。


这些数据充分证明,OceanBase 不仅支持各类新型负载,而且已经有越来越多客户在真实业务场景中落地应用,不断推动一体化数据库理念落地。


核心能力进化:一体化多云数据库的台前幕后


刚才分享了我们取得的诸多成绩,背后其实离不开技术架构和产品能力上的持续创新。今年,我们在这两个层面推出了不少新的能力,用以支撑未来不断涌现的新负载和新业务需求。


首先要分享的是存算分离架构。多年以来,OceanBase 一直坚持 share-nothing 架构,这种架构设计非常完美,但进入云时代后也带来了新的挑战,主要体现在成本和弹性敏捷性两个方面。虽然 OceanBase 在云上扩容、缩容已经非常便捷,但我们的理想不局限于此,还是希望能进一步提升。目前大规模集群扩容仍需要几个小时完成,但如果采用存算分离架构,就会完美实现我们的目标,能够在几分钟甚至更短的时间完成大规模集群的扩缩容。这个架构不仅有助于降本,更能显著提升敏捷性和资源弹性。


OB Cloud 的存储架构新增了一种共享存储架构模式,它基于存算分离架构设计,多节点共享一份全量数据到对象存储,并在本地缓存热点数据,配合自动冷热分离,实现高性能与低成本的平衡。


成本方面举个例子:如果将三副本变成一副本,计算成本可以降为三分之一。我们将基线数据存储在对象存储节点,仅将缓存数据放在计算节点云盘,可以将整体存储成本降低 60%-70%。更重要的是,采用存算分离架构后,扩容无需再复制所有存量数据到新节点,而是能够快速实现资源池弹性调度,大规模节点扩容的周期将从小时级缩短至分钟级。这样的新架构就能帮助客户显著降低使用成本,为客户带来更优服务体验。


第二部分是关于高可用能力。作为分布式数据库,OceanBase 在高可用领域具有丰富的创新和优势。我们很早就实现了机房级、机架级的容灾机制,既能在可用区内部进行故障切换,也可以在单个云厂商内部实现跨地域容灾。今年,我们在跨云容灾能力上又做了大量新突破。针对不同应用场景,OB Cloud 提供了多种跨云高可用架构:


最简单的一种是跨云备份,用户可以将数据库实例的数据备份到另一家云厂商,万一发生故障时,可以通过备份文件在其它云上快速恢复新实例。这种方式成本较低,但灾难恢复速度有限。


进一步,我们支持跨云主备实例,不仅解决了技术上的挑战,还针对实际业务场景做了产品化创新。比如,很多客户通过各自云厂商的 market place 购买 OB  Cloud 的实例,而不同云厂商的 market place 结算体系是完全独立的,对应到 OB Cloud 也会生成不同的账号。这一环节如何打通?


我们通过不同云厂商原有渠道的结算链路,并结合多账号授权的机制,让客户在不同云厂商 marketplace 上购买的实例,依然能够实现高度产品化的跨云主备架构。客户无需自己手动打通专线、手工配置地址切换,通过 OB Cloud 控制台简单点选,即可完成自动切换,实现跨云主备。除此之外,OB Cloud 还支持跨云多活,这是基于 OMS 双向数据同步实现的。


接下来讲一讲读写分离架构。OceanBase 在读写分离和灵活架构方面具备显著优势。得益于强大的内核设计,OceanBase 允许用户根据自身业务负载需求灵活选择最适合的架构方案,不同的架构在成本和收益上也会有所不同。


最早期,我们就支持主从副本架构。用户可以在一个实例的主从副本之间配一个指定地址,只承担只读请求,这样查询流量就可以直接分流到从副本上。然而,这种方式会存在一个问题:如果写负载或 TP 负载对于稳定性有很高的要求,那么会因为查询请求占用太多资源而导致稳定性受影响。


为此,我们进一步支持只读副本和只读列存副本架构,来解决资源隔离的问题。这样一来,将分析型负载独立部署到专门的只读节点,即使分析查询压力很大,也不会影响 TP 核心业务的正常运行。另外,对于分布广泛、希望实现区域就近访问的业务场景,比如全国乃至全球多地域部署,也可以采用主备实例的读写分离架构实现。


稳定可靠始终是 OceanBase 的核心竞争优势。这里我想重点介绍一下今年新发布的资源隔离功能


众所周知,OceanBase 采用多租户架构,每当你创建一个租户时,其实已经完成了第一层资源隔离。你可以为每个租户分配相应的 CPU、内存和 IOPS 资源。今年我们新增了对 IOPS 的隔离支持。


具体做法是:CPU 隔离依托 Linux 的 Cgroup 技术来实现,而 IOPS 则通过在支持的云厂商和机型上进行基准测试——提前测定每个盘型和机型的 IOPS 上限,然后锚定一台机器的 IOPS 上限,并在统一的  I/O 框架基础上,限制每个租户的  I/O 使用,保障不同租户之间互不干扰。


不仅如此,在租户内部,还能实现更加细粒度的资源隔离。OceanBase 支持在租户内给某个后台下的任务,甚至给单条 SQL 分别设置指定资源的上限、下限和权重。通过这种机制,可以让后台任务不会影响前台优先级任务的服务质量。如果业务有不同优先级,还可以创建不同 user ,给他们分配不同的上下限和权重这一能力在 OB Cloud 上同样可用,通过控制台白屏操作就能使用,并提供了内置的资源隔离模板用户可以现开箱即用。


关于 AI 能力,今年上半年我们发布了 PowerRAG,这是一个探索性质的功能,旨在让开发者以极低的成本体验 OB Cloud 。它为用户提供了 document 的 AI 能力——只需上传文档,系统就会自动进行文档解析,并维护向量化索引和全文索引。开发者可以通过 HTTP 接口,新建一个文档就可以调用接口拿到召回结果还可以通过 chat 接口实现知识库 RAG 架构下类似微调模型的的效果。


此外,在今天的发布会上,我们还在 OB Cloud 上架了最新的 OceanBase  4.4.1 版本,该版本带来两项重要的 AI 相关特性:


第一是混合搜索。用户可以在一条查询语句中,同时使用全文搜索、标量过滤和向量检索,系统会自动处理并进行智能综合排序,返回综合查询结果;


第二是 AI 函数能力,这一能力在云端实现得更加极致。只需点击启用按钮,这些 AI 函数就可以直接使用。包括文档向量化、Rerank、推理 等功能,系统后台会自动完成配置如何调用外部模型。


OB Cloud 2026年展望


最后,我想对明年做一个简要展望。其实这个环节通常会讲明年的发展规划,但详细内容还在密集调研中,我们也会在这段时间持续拜访客户,深入了解大家的实际需求。不过根据我的判断和理解,明年我们在三个方向上一定会取得显著的进展。


首先,一体化多云数据库的易用性将持续提升。我们最初在阿里云平台推出 OceanBase,去年年底正式从阿里云官网渠道切换至阿里云云市场,OB Cloud 逐步变得更加独立。过去几年,我们在 OB Cloud 上投入的人力相对较少,因为主要客户还是在阿里云。但今年以来,大部分研发和资源都集中在 OB Cloud。经过这一年的发展,我们有信心说,OB Cloud 今天在数据库稳定性、性能、功能丰富度等方面,已基本追平阿里云。这也让团队明年可以把重点放在易用性优化上。我们关注到无论是控制台功能、还是与企业内部系统的集成方式、监控、告警、诊断能力等,客户都希望多云体验能够真正一体化,不同云之间无差异。坦率而言,目前这些方面还不够完善,明年我们会持续强化产品易用性体验。


第二点是全球化。数据显示,OceanBase 在海外市场以及全球各区域的增长趋势非常明显。今年,我们明确提出了“GO GLOBAL GO Program——全球拓展计划”,组建了更多专注于海外市场的业务团队,以适应越来越多中国企业“出海”的需求。


在服务全球客户的过程中,我们发现他们对于多云部署的需求日益增强。例如,有客户希望在腾讯云国际站上部署 OceanBase,而目前我们只支持腾讯云中国站,国内与国际的体系仍然是分开的。类似的需求未来还会不断出现,这也反映出我们当前的多云能力还没有完全覆盖和满足全球市场的实际需求。面对这一趋势,明年我们将加快产品和渠道的全球化步伐,进一步完善和强化多云生态布局,更好地服务全球客户,为企业出海和海外数字化转型提供坚实的数据底座。


第三,是数据库在 AI 数据基础设施方面的角色,会有更加清晰的答案。今年年初大家关注的热点是 RAG,到年中则偏重 Agent,甚至一度有人认为 RAG 已过时,一个向量库就够了。但随着 Agent 架构的成熟,出现了大量“Agent Infra”和“上下文工程”等新型需求,也对数据库提出了很多新的挑战。


比如应用层多路召回、混合搜索对底层性能提出极高要求,以及混搜短期记忆、长期记忆等能力。我们观察到,Agent 落地案例愈来愈多,相信在这些实际场景推动下,关于数据库如何更好承担 AI 时代的角色,明年会有更加明晰的技术方向和落地方案。


最后,我想分享一个问题。此前在使用谷歌 Notebook LLM 时,系统提供了一个解读版本,最后一页抛出了这样一个问题——“你的数据架构为多云和 AI 驱动的时代做好准备了吗?”我认为这个问题非常具有前瞻性和思考价值。借此机会,也把这个问题分享给在座的各位,OceanBase 已经为多云和 AI 驱动的时代做好了准备,愿我们共同探索并迎接未来的数据架构挑战。


以上是我今天分享的内容,谢谢。


注:后续我们会陆续整理发布会的案例稿件,以及关于新产品的介绍,敬请关注后续微信公众号/视频号推送~❤️

号外号外!


创意大赛WeaveFox「AI 艺术家」创意大赛开启!

AI 时代已来,让你的灵感轻松变成现实!由 WeaveFox 联合 SEE Conf 发起的「AI艺术家」大赛即日起开放报名——一句话、一个灵感、一张设计图,借助 WeaveFox 的智能生成,就能打造属于你的 AI 应用。

零门槛创作,丰富奖品,行业曝光!还可通过邀友参赛解锁限量门票,在技术大咖面前展示你的创意。投稿时间截至 12 月 7 日。

立即点击【阅读原文】,登录 WeaveFox 官网,用 AI 创意点亮未来,让全世界看到你的灵感!

往期推荐


 点击「阅读原文」,参加创意大赛

【声明】内容源于网络
0
0
OceanBase
OceanBase专注原生分布式数据库研发,自研分布式技术,在普通的PC服务器上实现了金融级的高可用,拥有企业版、OB Cloud、社区版三大产品,已助力多个行业的千余家客户实现关键业务系统升级。OceanBase官方公众号,感谢您的关注。
内容 1053
粉丝 0
OceanBase OceanBase专注原生分布式数据库研发,自研分布式技术,在普通的PC服务器上实现了金融级的高可用,拥有企业版、OB Cloud、社区版三大产品,已助力多个行业的千余家客户实现关键业务系统升级。OceanBase官方公众号,感谢您的关注。
总阅读1.1k
粉丝0
内容1.1k