大数跨境
0
0

中国数据库赛道爆火,超融合数据库能成为下一代千亿巨头吗?

中国数据库赛道爆火,超融合数据库能成为下一代千亿巨头吗? 科创最前线
2022-07-22
0
导读:聚焦数据价值,超融合数据库想给客户“极简、极速”的体验。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

聚焦数据价值,超融合数据库想给客户“极简、极速”的体验。


作者 | 莫 莫
出品 | 科创最前线


WISH CHINA · 寻找2022中国新能源先锋力量榜单」评选正式启动。点击海报,了解活动详情↓↓





万物智联时代,数据源头和数据产生范式发生本质变化,“连接设备”取代“人类行为”成为新的核心数据生产源,“人物”相连走向“物物”相连。

新的场景带来消费方式变革的同时,新的数据存储和处理需求随之产生,用户群体也发生了变化,超融合数据库成为数据库赛道的新创业机会

目前,超融合时序数据库主要应用物联网、车联网、工业互联网、智慧能源、智慧城市、智慧园区、智慧交通等实时数据分析等场景。

四维纵横成立于2020年,是一家超融合时序数据库公司,能够在智能网联汽车、智慧能源、智能制造、智能装备、智慧交通、电信和金融等各个场景,实现数据实时入库、查询和分析,系统秒级响应。

其产品超融合时序数据库MatrixDB将关系、时序、GIS、JSON等多模数据融合和入库、查询、分析、ML/AI多场景融合,通过基于微数据库内核(microdb)的多核开放架构,实现一套数据库对多种数据类型、多种业务场景的统一支持,同时提供超高数据乱序写入和查询吞吐,并确保数据可靠,不丢、不错、不重。


7月7日,四维纵横创始人姚延栋做客「科创最前线会客厅」,分享《数字经济时代,融合数据基座如何赋能企业数智化转型》。

以下为编辑整理的直播分享内容:


01
数据库赛道的前世今生

发展至今,数据库已有60多年的历史,从时间脉络上看,一共经历了四个阶段:

第一阶段(上世纪80年代以前)

主要以非关系型数据库为主,网状数据库较多,关系型数据库尚处在酝酿期

第二阶段(上世纪80年代至2000年期间)

主要以关系型数据库为主,信息化时代下,业务系统从线下向线上迁移,关系型数据库的黄金时代到来,Oracle称王。

第三阶段(2000年到2020年)

主要以非关系型数据库为主,互联网和移动互联网时代下,大数据技术活跃,大量专用数据库诞生,出现了诸如Snowflake、Databricks、MongoDB、ElasticSearch等优秀的公司。

第四阶段(2020年至今)

万物智联的新时代到来,传统产业进入数字化转型的新阶段。

这一背景下,舞台主角变了,玩法变了,也需要全新的产品来服务这个大时代。超融合数据库成为了服务这个时代的最佳技术路径。

横向的发展脉络来看,数据库发展有OLTP数据库、OLAP分析型数据库、大数据/数据湖三条主线:

第一条主线OLTP数据库。

诞生自上世纪七八十年代,至今仍是非常活跃的领域。

该领域,Oracle 雄霸全球,主要玩家包括Oracle、SQLServer、DB2、各公有云厂商的RDS服务、Cockroachdb、YugabyteDB、TiDB等。

第二条主线OLAP数据库。

该领域百花齐放,但体量较小。

去年多家数据库企业在资本的支持下围绕这一路线创业,该市场技术基本延续国外技术路线,主要玩家包括Snowflake、Greenplum、Clickhouse等。

第三条主线为大数据/数据糊。

这个市场基本在走下坡路。

在国外这一趋势已被证明,技术路线代表 Hadoop 在不断走下坡路。

但国内一部分企业和组织仍在使用 Hadoop 技术栈,存在滞后性。

近几年,这个领域开始涌现出一批基于开源的数据湖项目,但也还处于相对早期阶段。


02
国产数据库的机遇与挑战

走入2022年,市场环境发生了巨变。


但即便是今天这样极端的资本寒冬之下,数据库赛道依旧在持续吸金,频频获得资本关注。


这是因为,今天的国产数据库赛道迎来了政策、市场和技术三大发展机遇:


政策侧上,受国际大环境震荡影响,国家发展基础科技的决心明确,要求在基础技术上要有原创,不能受制于人。

数据库作为“皇冠上的明珠”,还有很大的发展空间。


市场侧上,中国作为全球第二大经济体,有丰富的场景、真实的需求,这些需求最终会催生出优秀的数据库企业。

技术侧上,IT技术来源于美国,但是经过互联网和移动互联网时代的洗礼,中国已经积累了相当的人才资源和技术储备,开源也大大加速了中国技术发展的进程。

另外国际顶尖数据库的国内研发团队,譬如 Greenplum 培养了一批卓越的数据库内核开发人员,现在Greenplum在国内有4个创业分支,也很好的说明了这一点。


总的来说,当下数据库创业迎来了前所未有的需求机遇与技术机遇,如果数据库创业能碰到需求机会+技术机会的叠加点,那是再幸运不过了。

那么能不能说在数据库赛道创业是一门“好生意”呢?


实际上,即便当下诸多利好机遇摆在面前,我仍不认为是一门“好生意”。


其实数据库创业非常苦逼,在数据库赛道创业仍需要面临三大挑战:

1、数据库是软件领域最具有挑战的系统软件,复杂度高。

比如有国内基于Greenplum 做产品的企业反应,投入了十几号人做了一两年,结果却越做越差。

实际上数据库开发是“everything impacts everything”,很多时候做了一个特性,总价值不但没提升,反而还降低了。


2、数据库客户付费意愿相对低。

首先国内客户软件付费意愿低,更倾向为硬件、铁盒子付费。因此数据库企业产品定价也相对较低,其次国内数据库竞争比较激烈

此外,打造一款企业级数据库门槛高,时间周期长,新品稳定性难以被验证,客户在其成熟前往往不愿意付费。

3、人才要求高、人才贵。

数据库人才目前可能是最贵的人才之一。

也就是说,数据库创业做的是最具有挑战的工作,但即便产品做出来了,也有可能卖不上价,很难建立商业闭环。

不过好在越来越多的企业看到了数据库的价值。

一方面,客户们在经过“试点炼狱”之后越来越谨慎,已经开始要求数据库厂商去跑客户真实的场景。

另一方面,客户的付费意识和知识产权保护意识也在转变。

总的来说,数据库行业总体上仍在向好发展。


03
聚焦数据价值
超融合数据库想给客户“极简、极速”体验

万物互联之下,物联网、车联网和工业互联网飞速发展,数据生产发生了范式级别的变化——

过去是由人主动操作让设备被动产生数据,未来将是设备主动产生数据,数据量级将远远超过上一个时代。

除了数据量更大,数据种类也变得更多样、数据走向更加融合。

这些变化要求行业打造全新的、更卓越的数据基座。

物联网时代最突出的数据特征是时序,目前国内外绝大多数时序数据库还是延续十年前大数据时代的技术理念,采用专用数据库去解决某个特定领域的问题。

分析能力是一款时序数据库的核心能力,这一能力的构建需要长时间的高素质人才投入,否则数据库企业只能做时序的部分场景,分析还需要对接到Spark或者MPP数据库中。

在场景和技术巨变的今天,我们需要重新思考、定义时序数据库。

四维纵横基于对当下时代需求的思考和判断,提出了超融合数据库。


四维纵横为什么要提出超融合数据库这一概念?

数据库领域百花齐放,但核心是多样性数据和多样性操作两个维度的乘积,这种交叉造成了当下数据库品类繁多。

繁多的数据库为客户企业带来了很多棘手的痛点,如复杂的技术栈、门槛太高、投入巨大。


超融合的方案,就是要让大数据像水电气一样简单易用,把复杂度封装在数据库中。


超融合数据库的公式是:

超融合=多模态数据+全场景操作+高性能。

其中,“多模态+多场景”是对传统数据库智慧的挑战。

传统数据库往往认为“one size does not fit all”,超融合数据库是希望能实现“one size fits almost all”。

在和客户沟通交流时,四维纵横发现客户的需求是一个更简单更用的“魔法式”数据库,让自己更好地聚焦于数据价值上。

那么对比传统的数据库,超融合数据库能为客户带来什么好处呢?

总的来说,超融合数据库帮客户企业解决了性能、复杂度、成本上的三大核心难题:


1、效率问题和性能问题:

尤其是端到端的效率问题。

如果引用很多专用数据库解决每一个细分场景的问题,会额外增加逻辑复杂度。

有趣的是,在一些特定专有场景,超融合数据库比一部分专有数据库更好。

核心原因是数据库优化的底层逻辑很多都是相通的,为综合数据库优化后,很多经验可借鉴到另一个场景。

另外,数据库优化需要持续长久投入,很多专用数据库发展时间不足,无法达到极致水平。

超融合数据库的端到端效率更高,解决了很多单品数据库性能不足的问题。甚至在单个场景上,也比单品数据库性能好。

很多人好奇,超融合数据库是如何实现性能提升的?

首先,性能优化上的底层逻辑是相通的,一个场景优化到极致,也可以借鉴到另外一个场景中去;

其次,性能优化需要大量细节、指令级的调优,而关系型数据库在这方面已经发展了几十年。

2、复杂度问题:

一个数据库可以解决过去五六个数据库拼搭才能解决的场景问题,数据无需在产品间转来转去,技术栈精简,用户运维简单。


同一数据库打通不同数据源、产品的数据孤岛,不再需要DIY拼搭自己的数据基座底,从根子上解决数据孤岛问题,让用户聚焦于数据价值,而不是数据库价值上。

3、成本问题:


超融合数据库可以帮助客户节省50%以上的成本,帮助企业简化技术栈,降低人才门槛,四维纵横希望为用户做到多快好省、省心省力省时省钱,把“极简、极速”留给用户。

今天也有很多客户向四维纵横提问,相比于时序数据库或者分析数据库,一家超融合数据库企业的技术优势到底是什么?

实际上,多核数据库架构、自研的mars微内核、ACID 支持确保不丢数、高吞吐低延迟海量数据写入同时支撑高并发低延迟查询、In-database machine learning都是我们的核心优势所在。

其中,四维纵横主打的“多核数据库”方案具有很强的技术壁垒。

多核数据库使得我们可以在一个数据库内部实现多个微内核,每个微内核实现特定场景任务,各个微内核之间相互独立,而又共用很多通用组件。

不同微内核管理的数据可以直接关联(JOIN),为客户提供一个非常强大的存储和计算能力,打通数据之间相互独立,同时还能够通过关联(JOIN)实现数据共享。

但是多核数据库架构难、挑战大。不仅需要对数据库的各个层面都研究的极其透彻,还需要对场景和存储引擎有非常深刻的理解,这样才能做出针对一类场景而优化的存储引擎。


04
中国数据库有望跑出千亿级巨头
打好基本功是第一步

新的时代会有新的特征、新的业务场景,时代和舞台的主角也会发生变化,行业玩家也会发生变化。

IDC预计,到2026年,亚太地区(不含日本)在物联网(IoT)上的支出将达到4360亿美元。

当下,物联网机遇到来,中国具备非常大的场景优势,业内预计物联网最大的故事将会在中国出现,中国本土也有望出现市值1000亿人民币的数据库公司。

也就是说,今天国产数据库创业最大的机会,正是中国场景优势带来的机会。

中国数据库从业者有机会根据场景打磨产品,并在场景里不断迭代,最终取得全球优势。

对于中国数据库赛道的未来走势,我们也有自己的预判:

短期,数据库赛道竞争将走向激烈,并可能陷入同质化竞争。未来数据库企业将只有依靠明显的差异化路线,才能获得更大的机会。

长期,中国数据库市场将走向集中化,会出现头部企业,并且这些头部企业未来必定能引领世界数据库的走势。

技术侧,数据库架构未来5到10年间的大倾向性是走向融合,行业需要一个开箱即用的all-in-one的数据库。

这一数据库必须满足支持各种数据类型(包括关系、时序、gis、kv、json、text、点云、图等等),支持数据的各种操作(包括简单增删改查、oltp、olap、streaming、时序查询、gis查询、图查询等等)

多核数据库创新性地解决了上述问题,极大的降低数据库的复杂度,并提升数据库端到端的性能,做到多快好省,让用户可以像用水电气一样使用数据,真正的赋能产业数智化转型。

当然,细分领域的专业数据库仍然会存在,但是可替换性比较强,议价能力较弱,市场份额会比较小。

可以预期的是,中国一定会出现世界级的数据库公司。

一方面服务本土企业的数字化转型和万物智联业务需求、智能化需求;

另一方面基于中国的场景优势,本土数据库有望登上全球舞台与全球数据库同台竞技。

回过头来看,今天海内外市场上的玩家都在谈抓住机遇突围,那么今天企业之间需要比拼的赛点是什么?

可能有人认为拼的是产品力、营销力。

但在我看来,这是企业能力的结果,而不是企业发力的关键。

市场上的玩家要想突围,应该着重关注企业的系统能力,包括创新能力、试错能力、迭代能力、自我革新能力、理解客户场景的能力。

另外,数据库企业还要对未来趋势有准确的判断和把握,大方向如果错了,越努力越失败。


一句话总结就是,数据库创业应该将注意力放在基本功上,回归商业的本质,而不是表面的浮华。

把基本功做扎实,把产品打磨好,把客户的痛点和场景分析到位,形成独特优势,让客户愿意为产品买单,才能让企业获得长足发展。





关注「科创最前线」公众号
后台回复“报告
获取《2022最新硬科技报告合集》





科创最前线是一家专注报道科技推动产业创新的新媒体,致力于成为中国科创浪潮中的发现者、陪伴者、推动者。


我们聚焦中国科技创新产业发展,挖掘科创企业明日之星,深度跟踪头部科技企业动态及科技产业资本布局,推动科技在消费、出行、教育、文娱、房产、医疗等民生领域的落地。





【声明】内容源于网络
0
0
科创最前线
中国科技创新浪潮中的发现者,记录者,陪伴者。
内容 782
粉丝 0
科创最前线 中国科技创新浪潮中的发现者,记录者,陪伴者。
总阅读6
粉丝0
内容782