背景💻
大数据+AI 时代,图数据库凭借强大的数据关系处理能力,成为各行业的技术焦点。
上周六,nMeetup 在北京成功举办,5 位社区用户从图数据库架构(关系模型重构)、运维提效(故障根因定位)、Graph+AI (GraphRAG)、业务赋能(广告精准营销与数据治理)角度全方位印证:图数据库已成为企业解锁数据关联价值的核心基础设施。
跟随星云仔一起回顾精彩议程,下载 PPT,让 NebulaGraph 助力业务增益吧~
议题回顾📄
1️⃣某金融证券公司张潇 :《关系型数据库没有“关系”?论图数据库如何重构人际关系的存储逻辑》
(一)背景痛点
关系型数据库无语义描述能力,无法直观表达关系的强度、类型等属性;3 度以上关联查询需多层 JOIN,性能呈指数级下降,在社交网络分析、金融风控等实时场景难以满足业务需求。
(二)NebulaGraph 解决方案
存储重构:
采用属性图模型,将人/物作为点,关系作为边,实现关系的“显示存储”。查询革新:
通过图遍历替代复杂 JOIN,支持复杂关系实时探索(如“ 5 度关键人脉挖掘”)
(三)NebulaGraph 的应用场景
社交网络分析
合规检测:识别洗钱或黑产团伙(设备/IP/账号关联)
人际关系分析:关键节点挖掘(高净值客户识别)
金融风控实时
反欺诈:闭环交易检测(A→B→C→A 路径分析)
知识图谱构建:企业股权穿透(多层持股关系可视化)
Graph+AI
GraphRAG:知识图谱增强大模型推理
Text2GQL:自然语言转查询语句
2️⃣BOSS 直聘万佳飞:《基于 NebulaGraph 构建异常调用,实现根因定位》
(一)背景痛点
传统运维面临三大难题,使监控、日志、事件、trace 无法形成合力:
数据割裂:日志、监控、链路数据孤立,缺乏统一视图;
人工依赖:根因定位靠经验,跨团队协作效率低;
影响扩散:故障定界慢,MTTR(平均修复时间)长。
(二)图数据库选型
图数据库选 Neo4j 还是 NebulaGraph?BOSS 直聘的选型对比如下。
(三)NebulaGraph 解决方案
全域故障定位系统
1. 数据融合
整合链路追踪(Trace)、系统指标(Metrics)、日志(Logs)三大数据源,构建统一的全链路异常拓扑图,发现多个真子图分散出现在图结构中,每个子图都有“风暴中心”。
2. 图算法驱动定位
采用 PageRank 算法动态计算节点故障权重:
计算:Rank 值由节点出入度、链路错误数、事件进行加权计算
输出:Rank 值最高的 TopN 故障节点(即 “风景眼”)
3. 关联分析
通过图关系划分关联队列(直接故障节点)与非关联队列(间接影响节点),精准缩小排查范围。
应用示例
根因:该图描述了由于网络设备 A 端口故障,影响了主机,进而影响了应用 auth-service.
影响:进而链式传递影响了数个应用,风暴眼位 auth-service. 根因位网络设备 A.
(四)业务收益
利用 NebulaGraph 将复杂的业务故障定位问题转化为图计算问题,快速定位故障根因。
故障发现阶段:平均收敛时间 20s
故障处理阶段:平均响应时间 40s
故障恢复阶段:平均响应时间 2min
3️⃣中科数睿张哲源:《大模型与 NebulaGraph 结合的知识库搭建》
(一)背景痛点
中科数睿希望构建高效、智能的知识库系统,实现知识共享,提升组织决策能力和创新能力。但依赖传统 RAG,存在知识碎片化等问题,如:领导想知道某部门本周完成的工作,只能检索部分员工的工作事项。
(二)NebulaGraph 解决方案
NebulaGraph 提出了将图数据库与 RAG 结合的想法,并向 LlamaIndex 提了第一个 PR,将 RAG 转变为 GraphRAG. 通过构建知识图谱,将实体及其关系表示为图结构,在检索阶段利用图遍历获取相关子图,提供更丰富的上下文信息供 LLM 生成答案。
中科数睿基于 NebulaGraph,对大模型进行了微调,实现了企业级问答系统。
动态链路规划
1. 对 DeepSeek 等大模型做轻量指令微调,加入“反思-预估” prompt:
2. 模型先估计问题复杂度 c再用规则 N=f(C) 决定要展开的思考链(Chain-of-Thought) 长度
占位符式调用
训练模型在遇到 function_call/ 外部 MCP 服务时,以 §FUNC i§ 等占位符输出,并返回参数草稿。
4️⃣阿里妈妈承开(宋铭涛):《NebulaGraph 在阿里妈妈营销场景的应用实践》
(一)背景
阿里妈妈营销引擎团队深耕广告领域,依托淘宝和全网海量的用户行为数据,不断完善和构建一套基于阿里大数据,可以支持广告主实时进行投放策略智能洞察分析、定向投放目标用户、优化投放效果的交互式分析系统。
“同款商品”识别因算法误差产生异常点:
传统聚类方法置信度低,无法关联商品间隐藏关系;
海量商品数据关联分析性能瓶颈突出。
(二)NebulaGraph 解决方案
同款商品异常点检测
1. 图模型设计
商品作为点
同款关系作为边:商品之间是否为同款,已经对应的 score,后续可以添加图像相似度等信息
2. K-hop 子图查询
输入:待预测的 pair
输出:k-hop 子图(主要关注 1-hop 和 2-hop)和子图节点的 feature
(三)技术实现
NebulaGraph 在阿里妈妈的架构
数据 Bulk-load 方案
利用离线 ODPS 资源构造图数据内部的二进制文件,之后利用图数据库的封装的 RocksDB 的 ingest 函数操作 load 构造的二进制文件,以实现批量大数据导入图数据库。
(四)未来规划
阿里妈妈团队有对 RocksDB 和其他 kv 数据库进行二次开发,未来希望与 NebulaGraph 结合,以 PR 的方式贡献社区。
5️⃣京东物流李世豪:《NebulaGraph 在京东物流一站式分析平台 UData 的探索与实践》
(一)背景
京东物流作为中国领先的供应链解决方案提供商,每天需要处理海量、多源、异构的业务数据,每月做数总耗时高达百万小时,面临做数耗时长、数据来源多、需求变化快等业务痛点,亟须对海量数据进行高效管理。
(二)数据库选型
图数据库天然适配复杂数据关系场景,拥有活跃的开发者社区,并且 NebulaGraph 提供专属查询语言 nGQL,对比 Mysql, nGQL 简洁高效,极大提升了语句的可维护性,代码量降低 80%,京东物流基于上述原因,选择使用 NebulaGraph.
(二)NebulaGraph 解决方案及业务收益
在 UData(京东物流数据一站式分析平台)落地 NebulaGraph 后,实现了以下业务收益:
集群路由与缓存优化
1. 引入冷热数据分离策略,高频访问的“热数据”优先缓存,查询延迟降低 60%.
2. 通过物化视图预计算相似节点(如用户-资源关联路径),加速报表生成。
查询性能提升
1. 优化 WHERE、LIMIT 等子句的执行计划,结合索引减少全图扫描。
2. 监控集群状态,动态调整资源分配,避免热点瓶颈。
典型场景应用
1. 血缘分析:快速追溯指标来源,定位数据异常根因。
2. 权限校验:实时判断用户是否有权访问某资源,响应时间<100ms.
3. 数据成果:整体查询性能提升 5 倍,复杂血缘分析任务从分钟级降至秒级。
PPT 获取🔗
点击「阅读原文」访问 NebulaGraph 论坛下载完整 PPT
(⚠️因部分分享内容仅限线下交流,故本场 nMeetUp 不提供直播回放。)
致谢❤️
特别感谢张潇老师、中科数睿、BOSS 直聘、阿里妈妈、京东物流以及 AdventureX、中关村创业大街的大力支持~
✦
如果你觉得 NebulaGraph 能帮到你,或者你只是单纯支持开源精神,可以在 GitHub 上为 NebulaGraph 点个 Star!每一个 Star 都是对我们的支持和鼓励✨
https://github.com/vesoft-inc/nebula
✦
✦
扫码添加
可爱星云
技术交流
资料分享
NebulaGraph 用户案例
✦
风控场景:携程|Airwallex|众安保险|中国移动|Akulaku|邦盛科技|360数科|BOSS直聘|金蝶征信|快手|青藤云安全
平台建设:博睿数据|携程|众安科技|微信|OPPO|vivo|美团|百度爱番番|携程金融|普适智能|BIGO
✦
✦

