TOP100 Summit
Top100全球全球软件案例研究峰会(TOP100Summit)是科技界一年一度的案例研究峰会。峰会面向国内外软件/互联网领域研发团队征集优秀案例,经由行业资深技术专家组成的出品人团队筛选,最终甄选出最具分享价值的100个技术创新/研发管理实践入会,共同解读、点评,分享企业在本年度最值得总结、盘点的实践启示。
2020 TOP100大会于12月18日-20日在北京举办,苏宁易购旗下科技集团大数据中心高级架构师杨兆辉,携《ClickHouse在苏宁用户画像场景的实践》案例参会,并分享了苏宁全场景大数据用户画像实践。
杨兆辉
苏宁易购旗下科技集团大数据中心高级架构师,ClickHouse Contributor。在 OLAP 领域、大规模分布式计算领域有着深厚的技术积累,目前负责数据中台、标签平台相关的架构工作。曾就职于中兴通讯10+years ,从事大规模分布式系统研发。
案例简述
重点讲解了ClickHouse在用户画像场景下的性能优化思路,以及对其进行深度定制的功能特性。
案例背景
成功(或教训)要点
RoaringBitmap是一种广泛使用的Bitmap压缩算法库,通过将其集成到ClickHouse这款优异的OLAP分析引擎中,让ClickHouse在一行记录中可以保存大量的id信息。将标签模型用Bitmap的方式进行存储、计算,极大的提升了性能,同时在空间耗用上也比较低。在人群筛选、用户画像场景中发挥了很好的作用。在数据模型设计上充分挖掘了ClickHouse分布式并行计算的特性。亿级用户标签查询,秒级响应,带给用户很好的查询分析体验。
案例ROI分析
1、亿级以上人群画像响应时间在2到3秒,原先为20多秒。
2、支持标签数据准实时更新。
3、存储容量、数据导入性能、查询性能,可以通过增加机器线性扩展。
4、相对于ElasticSearch的配置,可以节约一半硬件资源。
5、标签表达式和查询SQL对用户来说比较友好,提升系统的易维护性。
案例启示
找到一款优异的开源软件,根据业务场景进行深度定制,让其更切合场景化需求,快速为用户创造价值,避免了重复造轮子,同时也将新增的功能特性回赠给社区,促进开源软件的进一步发展。

关注苏宁科技公众号并回复“用户画像”,即可获得完整案例内容。

