大数跨境
0
0

对话晨章数据CTO张桓:中国企业出海需要更优质的合作伙伴

对话晨章数据CTO张桓:中国企业出海需要更优质的合作伙伴 晨章数据
2025-09-12
2
导读:少安老师带您揭秘晨章数据创始团队



专栏导语

AI 时代数据洪流来袭,晨章数据以创新 “数据基层” 架构破局!旗下分布式数据库系列产品,实现计算、内存、日志、存储四元解耦,0.1ms响应跨模态需求,更全面开源赋能生态。本专栏将邀请五位嘉宾,从不同视角深探晨章数据的领先之道

解析云原生弹性架构优势,探索新硬件红利,看 AI 原生数据库如何突赋能AI创业者,锚定市场痛点破局,听创始人拆解技术创业逻辑,干货持续输出,敬请关注!


本篇特邀数据库领域专家严少安,专访晨章数据CTO张桓,介绍其团队源于微软亚洲研究院等机构,以 “数据基层” 创新架构打造产品,四年深耕后开源核心产品。产品具高性能、弹性扩展等优势,适配 AI 时代,助力中企出海,兼顾合规与成本。


严少安

Oracle ACE,PostgreSQL ACE,ITPUB、IfClub、墨天轮等多家社区专家团成员。长期分享数据领域技术干货,聚焦国产数据库业态发展。《少安事务所》出品人。



编者按

笔者与晨章数据 CTO 张桓的初识,源于几个月前一杯咖啡的短暂交流。彼时虽仅匆匆数语,却已能感受到他对数据库技术的深刻理解与对行业趋势的敏锐洞察。近期,随着 2025 年上海合作组织峰会在天津落幕,“中国企业出海”再度成为热议话题,而数据的合规存储、成本控制作为中企出海的核心挑战,也让笔者再次将目光投向晨章数据——这家以“数据基层”创新为核心的数据库厂商。此次访谈,我们将围绕技术历程、产品优势、AI 时代布局及企业出海支持,探寻晨章数据如何为中企出海打造安全、高效的数字底座。


01

从一杯咖啡开始的缘分

初见张桓,便能感受到他身上典型的技术人特质:内敛沉稳,谈及技术时眼中却格外有光。他的数据库研发生涯始于分布式系统与事务处理方向,在这个领域有扎实的理论基础和丰富的工程实践经验。谈及个人技术经历,他笑着说:“2008 年底,Greenplum 进入中国市场。那是一个源自北美的 OLAP 数据库团队,产品主要优势在于使用大规模并行处理(MPP)架构来支持数据挖掘和商业智能。我之前一直在北京的团队担任技术负责人。”过去十年,国产数据库崛起,近 300 多家数据库厂商涌现,NewSQL、分布式数据库、云原生数据仓库等概念不断落地,并广泛使用,积累了大量生产实践案例。期间,陆续有几支技术队伍从 Greenplum 出来创业,但无一例外还是对国外产品的本土化复刻,缺少本质性的架构创新。


2021 年某一天的咖啡馆里,刚从微软亚洲研究院出来创业的陈亮(现晨章数据联合创始人、首席架构师),给张桓描述了一个全新的数据库架构理念,一种通过解耦数据库内核、抽象通用模块实现“乐高式拼装”的创新方案。它不是国外某个流行产品的复制品,而是将要解决 Google Spanner 架构带来的性能牺牲问题。这个想法让张桓眼前一亮,彼时国产数据库虽迎来爆发期,但多数厂商仍停留在“跟随式创新”,尤其是 NewSQL 数据库都在遵循 Google 提出的 Spanner 架构,就像 Hadoop 实现 Google 的 GFS 一样。但 Spanner 为了支持可扩展性和强事务,牺牲了高性能。


陈亮提出的基于数据基层(Data Substrate)的新型架构,与 Spanner 架构演进出的 NewSQL 数据库不同,它能在保证分布式事务与高性能的前提下,实现缓存、日志、存储的独立弹性伸缩。新架构理论上可同时实现高性能、可扩展性和强事务,这正是数据库领域的“不可能三角”难题。“我们的目标是做一个世界领先、有自己独特技术的数据库管理公司,而不是简单复制国外的产品。这不仅是技术情怀,更是国产数据库在全球化竞争中必须走出的道路。”,也正是这个原创理论和技术愿景打动了张桓,让他毫不犹豫地加入了晨章数据,成为创业团队的一员。


学院派技术团队

晨章数据的技术团队是其核心竞争力之一。“我们团队的研发人员在北京,核心成员几乎都来自微软亚洲研究院、VMware 研发中心,在 VLDB、SIGMOD 等顶会发表过多篇论文,既有深耕数据库领域几十年的研究型人才,也有丰富工程实践经验的技术骨干。”,张桓介绍道,“我们的创始人团队研究背景非常强,晨章数据联合创始人、CEO 张霖涛博士是顶级分布式专家,IEEE Fellow 和 ACM Distinguished Scientist,他早年的 Principle 论文协议被 Kafka 和 Elasticsearch 广泛采用,Google Scholar 引用数超过 1.3 万次。”[^1]


“我们从零开始构建了整个数据基层,没有依赖任何开源框架,目前已申请多项国内外专利,后续还计划将核心技术以论文形式公开,让行业共享创新成果。”,不过,张桓也坦言,团队虽偏“学院派”,却始终注重落地场景:“我们经常和企业 DBA、开发者交流,了解他们在实际使用中遇到的痛点,比如 MongoDB 扩展时的数据迁移难题、Redis 分布式事务的局限性,这些反馈都成为我们产品迭代的重要依据。毕竟,再先进的技术,只有帮助客户解决实际问题才能体现价值。”


02

四年低调深耕,成熟产品开源

自 2021 年底成立,2022 年完成数千万元天使轮融资以来,晨章数据并未急于发声,而是用四年时间精心打磨产品。如今,以“数据基层”为核心的产品矩阵已正式落地,并将核心产品开源,成为其打开国内外市场的关键抓手。


谈及产品的核心竞争力,张桓首先提到数据基层的“四元解耦”架构。传统数据库的计算、存储往往绑定在一起,扩展时只能整体扩容,造成资源浪费;即便是“存算分离”框架,也在不同层级的“存储”上有限制和局限性。他介绍到,“我们将数据库拆解为计算、内存、Redo 日志、存储四个独立模块,四模块彻底解耦,每个模块均可根据负载弹性伸缩。比如写入瓶颈时,只需扩展 Redo 日志盘,无需增加 CPU 和内存;历史数据增多时,仅扩展存储即可,成本优势非常明显。”


基于“四元解耦”架构,上层可以实现传统 SQL、键值(Key-Value)、文档(Document)、图(Graph)等多模态计算方式,也可以快速构建一种新模态的数据库产品。这种架构设计,不仅适配云原生环境的弹性需求,更解决了传统分布式数据库的性能痛点。“以 Spanner 为代表的 NewSQL 数据库,为了保证分布式事务,提供高可扩展性,会牺牲部分性能。而我们通过数据基层的缓存一致性协议、异步 Checkpoint 机制,在强事务前提下,将读响应延迟降至亚毫秒级,写 QPS 提升数倍。”。此外,在工程实现方面,由于采用最新理论模型进行落地,所以没有历史包袱,可以轻装上阵。


旗舰产品

晨章数据现阶段聚焦三款核心产品,均基于数据基层架构构建:EloqSQL、EloqKV、EloqDoc。三款产品均具备标准 API 接入、支持事务和高并发、弹性架构适应云环境,并在 AI 对接上具有更强的系统效率与智能优化能力。EloqDoc 是一款兼容 MongoDB 的分布式文档数据库,EloqDoc 可平替 MongoDB v4,兼容性优于亚马逊的 DocumentDB。EloqSQL 是一款兼容 MySQL 协议,具备弹性伸缩、计算存储分离、分布式事务与列式压缩等优势,在关系型数据库架构中提高 AI 时代的适应性与性能。


EloqKV是一款兼容 Redis API 的高性能分布式事务型企业级键值数据库,具有 ACID 事务支持、自动分层存储(热、暖、冷层),支持跨节点事务一致性。EloqKV 解决了 Redis 分布式场景下的诸多局限,EloqKV 采用多线程架构,能充分利用 CPU 多核资源,在 32 核机器上可实现 160 万 QPS,远超传统 Redis 单线程性能。EloqKV 还实现了自动冷热数据分层,最热数据在内存,然后是本地 NVMe SSD,最后冷数据存对象存储,既保证性能又节省成本。用户把 Redis 当缓存用,本质上还是 Redis 可靠性不足,诸多业务需要的是“缓存级性能+数据库企业级可靠性”,现在很多客户直接将数据迁移存储到 EloqKV,无需再落盘到其他关系型数据库。


开源共建

2025 年 2 月,晨章数据将 EloqSQL、EloqKV、EloqDoc 等多个模块的核心代码正式开源,迈出了构建开放生态的重要一步。目前这些项目托管在 GitHub,已开源十余个项目,并保持高频更新,开源半年多,EloqData 的开源项目已累计获近 700 点星关注。欢迎全球开发者:点星关注、试用与反馈、参与社区讨论。


“我们对开源的态度很明确:不做‘伪开源’,不会通过更改协议收割用户。”张桓表示,团队承诺长期保持开源协议稳定,让开发者有一致的使用体验。目前,EloqData 开源项目已吸引来自北美、欧洲、东南亚的众多开发者参与,用户可通过 GitHub 提交需求与 Issue,部分外部 PR 已被合并入主线版本。未来,晨章数据还计划通过多种形式扩大开源影响力,比如定期举办线上研讨会、线下 Meetup 和激励开源贡献。


03

兼顾性能与成本,

AI 时代数据库需要新的技术储备

谈及 AI 时代的数据库需求,张桓认为,传统互联网时代,数据是应用的副产品。而 AI 时代,数据变成了应用的“燃料”,应用从构建的第一天就需要大量数据来建立模型和知识库。这种变化给数据库带来了新的挑战。一个 AI 小产品可能就需要五六种数据库:用文档型数据库保存聊天历史,用向量数据库存 Embedding(嵌入,大模型术语),用图数据库保存实体之间的关系,用键值数据库保存 Agent 的工作记忆,等等。如果使用传统方案,安装管理多种类型的数据库,每个数据库可能会用不同版本,数据库管理的复杂性、运营成本、人力成本都会成倍提升,更大的挑战是,数据存放在不同数据库里还会带来一致性问题。比如一份财务报告写入 MongoDB 成功,但写入向量数据库失败,导致无法通过语义检索;反之则会出现“空链接”。


为此,晨章数据提出了 AI 原生数据库的理念,正在筹备推出一款对 AI 应用更友好的新产品,敬请期待。“它能把SQL、文档、键值、向量等不同计算模态融合到一个数据库里,可实现跨模态事务。”张桓举例说:“用户可以在一个事务里插入文档,同时往向量库写 Embedding,任何一步失败都会整体回滚,就像使用传统单机 MySQL 一样简单。”这是符合 AI 时代趋势的,未来 AI Agent 之间的通讯将是海量的,每秒成百上千次,单机数据库根本无法应对如此庞大的计算量。晨章数据的数据基层架构在性能、事务和可扩展性三个方面同时满足要求,数据基层屏蔽底层存储差异,通过标准 API 提供一致视图,避免 Agent 因数据源差异产生逻辑冲突。而数据基层的“四元解耦”架构,可以单独扩展某个模块,比如面对 AI 应用的写入流量洪峰,可以单独扩容 Redo 日志模块,提升 IOPS,无需实例级扩容。


EloqDoc:AI 时代更好用的 MongoDB

毫无疑问,晨章数据依据原创理论打造的产品是符合 AI 时代需求的。以EloqDoc 为例,它强兼容 MongoDB 协议,开发者可平滑地数据迁移至 EloqDoc,原有用户习惯得到保留。在保证产品高性能、强事务的同时,可帮助客户有效节省成本。传统 MongoDB 采用 Shared-Nothing 架构,新增节点需迁移全量数据,对于大数据量项目,扩展耗时往往长达数小时。


而 EloqDoc 采用“四元解耦”架构,计算、内存、Redo 日志和存储四个模块的解耦,每个模块可单独扩缩容,新增计算节点无需移动数据,分钟级即可完成扩容,相较于传统 MongoDB “弹性”优势突出。“成本”优化是 EloqDoc 的另一大亮点,“相比阿里云、AWS 的 MongoDB 云服务,EloqDoc 能节省 70% 以上的成本。”张桓从存储层、网络层和计算出三个方面进一步解释道。持久化数据存储采用更具性价比的方案,用对象存储(如 S3)替代云盘,单价仅为云盘的 1/3,且避免传统 MongoDB “三副本+云盘多副本”导致的“九倍数据写入”冗余。通过对象存储的跨可用区特性,减少 30%-40% 的跨 AZ 数据复制费用,这是传统云数据库的隐形高成本项。在计算层,通过采用计算单副本、存储多副本的高可用方案,CPU 与内存成本直降 60%。EloqDoc 对存储介质有着更为精细的考量,计算节点的本地 NVMe SSD 作为对象存储缓存,保证读性能;通过对象存储的多副本和异步 Checkpoint 机制,大幅减少了数据拷贝,减少高频 IO 开销;Redo 日志保存在云盘,满足低延迟、高 IOPS 需求。


04

陪伴中企安全合规、成本可控出海

随着中国企业出海步伐加快,数据的合规性与成本控制成为海外布局的关键挑战。张桓表示,晨章数据早已针对出海场景做足准备,致力于成为中企出海的“数字底座”。EloqDoc 提供标准 MongoDB API 接口,已上架 AWS 云市场,并在适配 GCP、Azure 和 OCI 等云厂商,选择 EloqDoc 的出海企业可无缝切换云厂商,提升业务灵活性,避免供应商锁定。数据合规是中企出海的“生命线”,晨章数据的 DBaaS 数据库服务已通过 SOC 2 数据合规认证,能够满足欧美市场对数据安全、隐私保护的严格要求。国外公有云发展更成熟,企业在海外部署数据库时选择云产品已经成为事实标准。但海外公有云服务成本较高,而晨章数据的架构设计能显著降低支出。相比于 AWS DynamoDB、阿里云国际站的 MongoDB 云服务,EloqDoc 通过数据基层架构,由“四元解耦”来精细控制资源使用成本,为中国企业出海提供成本比传统方案更具性价比的产品。此外,晨章数据作为本土企业,可更及时、更有效的服务我们中国出海的企业,让中国企业可以在全球以更低水位线成本快速试错、快速扩张。


05

结语

从突破分布式数据库“CAP 不可能三角”的技术初心,到落地兼容 SQL、键值、文档等主流生态的产品矩阵,再到面向 AI 时代多模融合数据库与中企出海的数字底座,晨章数据用了四年时间,走出一条“原创技术+场景落地”的道路。正如晨章数据 CTO 张桓所说,“数据库行业没有一蹴而就的成功,唯有持续倾听用户需求、不断突破技术卡点,才能在 AI 时代与全球化浪潮中立足。”





上期回顾


云基座技术是大厂专有,

那小厂和私有云的出路在哪里?


EloqData——乘硬件之风,破创新之浪


深度研究报告 | 

AI智能体所需的数据库产品及未来发展趋势


面向“AI+云时代”重新定义数据库



【声明】内容源于网络
0
0
晨章数据
内容 33
粉丝 0
晨章数据
总阅读7
粉丝0
内容33