在数据存储的广阔天地中,日志存储一直是技术爱好者与从业者热议的话题,曾经,ElasticSearch(ES)与ClickHouse(CK)的对比成为行业内的常态。然而,时过境迁,ES的讨论声渐行渐远,ClickHouse则屹立不倒,成为Doris等新兴数据存储引擎的对标对象。
作为深耕智能运维领域多年的擎创科技,我们见证了数据存储引擎的兴衰更替,本文将深入探讨为何ClickHouse能够取代ES,以及ClickHouse(CK)如何在Doris的强势冲击下,在大数据领域占据半壁江山。
在开源的旗帜下,Doris、ClickHouse与ES各自展现着不同的风采,Doris社区版与商业版功能高度一致,体现了对开发者友好的承诺,而ClickHouse的Cloud版本则通过新增功能,进一步拓宽了应用场景。
从信创适配的角度来看,Doris作为国内自主研发的数据库,无疑具有先天优势,然而,Doris也面临着安全漏洞较多的挑战,这对于金融等严格要求安全的行业来说,无疑是一道难以逾越的门槛,相比之下,CK虽然也有其不足,但在安全性和功能扩展性上表现更为均衡。
(
基础属性对比
)
查询能力:各有千秋
Doris:以其均衡的综合查询能力著称,虽无惊艳之处,但胜在稳定可靠,适用于多种场景
ClickHouse:在单表和聚合查询方面展现出极致性能,堪称无敌;但在多并发查询、多表join和模糊查询方面仍有提升空间(尽管最新版本已有所改进)
ES:倒排索引能力依旧是其核心竞争力,历经多年仍稳坐江湖霸主地位
(
性能与资源查询能力对比
)
存储能力:写入与压缩的较量
写入速度:Doris通过服务端攒批、异步写入的方式,实现了高达150万条数据每秒的写入性能,但数据可见性略有延迟,ClickHouse则以其所见即所得的写入体验,赢得了用户的青睐
压缩比:ClickHouse在数据压缩方面展现出倍数级领先优势,有效降低了存储成本
(
存储能力对比
)
存储策略
Doris:通过RESOURCE和POLICY概念,实现了生命周期的轻量级管理,但依赖存储时间而非业务时间,且表关联资源后无法删除
ClickHouse:以磁盘为核心,数据可随意移动,生命周期管理更加灵活,但磁盘变动需重启服务,存在服务中断风险
在资源占用、资源隔离及限额方面,ClickHouse与Doris均表现出色,难分伯仲,Doris在某些细节上更为精细,但整体而言,两者均能满足企业对资源高效管理的需求。
(
资源管理对比
)
集群复杂度
ClickHouse:其集群架构复杂,涉及副本、分片、MergeTree表引擎等多个概念,对新手而言门槛较高。zookeeper(或clickhousekeeper)的引入更是增加了运维的不确定性
Doris:采用BE、FE极简架构,部署简单,上手快,且完全兼容MYSQL协议,对开发者极为友好
(
运维与扩展对比
)
运维工具
擎创科技凭借多年ClickHouse技术积累,开发并开源了ckman集群运维工具,有效降低了CK集群的运维压力,为行业贡献了宝贵经验
Doris与ClickHouse之争,犹如自动挡汽车与手动挡性能跑车的较量,Doris秉承“中庸”之道,各方面表现均衡,既无惊艳之处,也无明显短板,而ClickHouse则如同偏科生,在擅长的领域一骑绝尘,却在某些短板场景下表现不尽如人意。
随着可观测领域的兴起,ClickHouse已成为Metric、APM存储的标杆性代表,被众多知名互联网公司推广使用,而Doris虽在可观测场景上持续发力,尤其在日志处理方面表现突出,但其他领域仍有待深耕。
(
总结对比
)
在擎创科技的产品体系中,我们并不局限于某一数据库的优化,而是致力于通过统一查询层入口,屏蔽存储层差异,实现对多种数据库的无缝检索查询。
这种解耦设计不仅适配ES、CK、Doris等多种数据库选型,更好地融入客户现有技术架构,更为未来可能出现的更强数据存储引擎预留了灵活的可扩展空间。

擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司专注于通过提升企业客户对运维数据的洞见能力,为运维降本增效,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择

