大数跨境
0
0

AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中

AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中 阿里云大数据AI平台
2026-01-07
10
导读:Hologres 所倡导的 HSAP 2.0 正致力于成为这一基础设施——让80%沉睡在非结构化数据中的企业知识,真正被AI激活。

2026年,AI 进入“应用爆发年”,但一个残酷现实浮出水面:模型越来越聪明,输入却越来越混乱

正如全球知名风险投资机构 a16z 在《 Big Ideas 2026[1]》中指出:

“非结构化、多模态数据既是企业最大的瓶颈,也是最大的未开发宝藏。每家公司都在被 PDF、截图、视频、日志、邮件和半结构化数据泥潭淹没。”——a16z 称之为“非结构化宇宙”。

这并非危言耸听。国际数据公司(IDC)在 IDC DataSphere 报告中预测[2] 到:非结构化数据的增长速度更快,2023-2028年复合年增长率达到49.3%。

模型的输入越混乱,AI 就越容易“犯错”:RAG 系统产生幻觉,Agent 在关键流程中悄悄出错,最终仍需人类反复校验。a16z 将此归因为“数据熵”——即在非结构化数据中,信息的新鲜度、结构化程度与真实性的持续衰减。

正因如此,清理、结构化并持续治理多模态数据,成为企业必需的能力。从合同分析、理赔处理,到销售支持、工程搜索,再到每一个依赖可靠上下文的 AI Agent 工作流——需求无处不在。

而要支撑这些场景,现有架构往往无法很好的兼顾:向量数据库擅长语义搜索,但无法做基于标量的业务分析,例如统计 GMV 等;传统的 OLAP 数据仓库能跑报表,却读不懂一张图片。两者靠 ETL 管道同步,不仅引入延迟,还带来数据不一致、运维复杂、成本翻倍等问题。

一种全新的数据平台正在诞生:它既能像向量数据库一样理解语义、检索图片和文档,又能像数仓一样运行复杂分析——这就是 Hologres 为 AI 时代打造的一体化引擎

从分析型数仓到HSAP 1.0:Hologres 的第一次进化

要理解 Hologres 如何走向 AI 原生,必须回溯它的起点。

企业普遍面临一个经典架构矛盾:高并发、低延迟的在线服务查询(Serving)。传统技术栈中,这两类负载对系统的要求截然相反——Serving 需要毫秒级响应和高吞吐点查,Analytics 则依赖大规模扫描和复杂聚合。因此,企业不得不维护两套系统——MySQL 处理毫秒级用户查询,Greenplum 或 ClickHouse 执行分钟级报表分析,中间靠 Kafka + Flink 做数据同步。这套“双写架构”复杂、昂贵,且一致性难以保障。

Hologres 在 2020 年提出的 HSAP 1.0(Hybrid Serving/Analytics Processing)正是为了破解这一困境。它首次在工业界实现了“一份数据、统一存储”,同时高效承载 Serving 与 Analytics 两类负载。这一架构创新被总结为 “统一分析与服务处理”(unified analytics and serving processing),并作为系统性成果发表于数据库顶级会议 VLDB 2020,标志着实时数仓与在线服务融合从工程实践走向学术认可。它成功支撑了淘宝双11每秒数亿条写入、毫秒级响应的极端场景,成为实时数仓领域的标杆。Hologres 在阿里双十一流量高峰下处理每秒高达5.96亿条记录的经验[3],以及淘宝推荐系统实现毫秒级响应的能力,都为这种高吞吐、低延迟的混合存储架构提供了坚实的实战背书。

但 HSAP 1.0 的“Serving”本质仍是结构化查询——比如“查用户ID=123的订单”。而 AI 时代的需求已升级为语义级理解——比如“找和这张穿搭图风格相似的商品”或“从10万份PDF中找出与‘数据合规’相关的条款”。

当 RAG、多模态 Agent、企业知识库成为主流,单纯的点查+分析已不够用——AI 需要的是“搜索”(Search)。正是这一需求,推动 Hologres 向 AI 原生迈出关键一步。

让AI直接“读懂”企业数据:Hologres的AI原生新架构HSAP 2.0

Hologres 的新架构并非简单叠加向量数据库功能,而是一次面向 AI 负载的深度重构。它将“语义搜索”与“多维分析”原生融合于单一引擎,让企业用一套系统同时支撑 AI 检索与业务分析,彻底告别“拼凑式”架构。

在 Agent 原生时代,企业 AI 应用正面临真实而迫切的业务挑战:

  • 智能客服需要在秒级内从数万份产品 PDF、历史工单和知识库中,精准定位与用户问题最相关的答案,避免“一本正经地胡说八道”;

  • AI 销售助手既要理解客户邮件中“预算有限但希望高端感”的模糊语义,又要结合结构化数据(如客户等级、历史成交价、库存)生成个性化提案;

  • 内部知识 Bot 需融合会议录音转写的文本、Jira 任务、Confluence 文档,在一次问答中回答“上次关于支付失败的讨论结论是什么?是否已上线修复?”;

  • 保险理赔 Agent 要同时解析用户上传的事故照片(向量检索)、OCR 识别的保单文本(全文检索)和后台理赔规则库(结构化分析),实现端到端自动化。

这些场景的共性是:一次 AI 交互,往往同时包含语义搜索、关键词匹配、实时分析与高并发请求。传统的组合架构,在数据一致性、查询延迟、运维成本和系统稳定性上面临挑战。

为此,Hologres 构建了新一代 AI 原生数据引擎——HSAP 2.0 (Hybrid Search/Analytics Processing)即分析和搜索的混合处理架构,其核心是为上述混合负载量身打造的四大技术支柱,它们共同构成了一个为 AI 负载而生的一体化技术内核,旨在解决成本、精度、弹性和稳定性等核心挑战。


内存+磁盘混合存储:百亿级向量检索的性价比方案

第一大支柱是内存+磁盘混合存储,它为百亿级规模的向量检索提供了极致性价比的解决方案。全内存向量数据库虽然能提供极快的响应速度,但在面对海量数据时,存储成本会呈指数级增长,使其难以被广泛应用。Hologres 发布全新的向量检索引擎 HGraph,实现了创新的分层存储架构。该架构将高频访问的向量数据和索引缓存在高速内存中,而将冷数据持久化到成本更低的磁盘上。这种设计在保持亚秒级响应的同时,大幅降低了总体拥有成本,使得企业能够负担得起训练和使用大规模AI模型所需的数据基础,真正实现“训得起也用得起大模型大脑” 。

深度融合全文检索:补齐语义搜索的最后一块拼图

第二大支柱是深度融合全文检索,这是补齐语义搜索最后一块拼图的关键。纯向量检索易漏掉 “iPhone 15 Pro” 等精确词;纯关键词无法理解“高端商务手机”等语义。HSAP 2.0 发布支持 BM25 的全文检索能力,支持单次查询融合向量与关键词,大幅提升 RAG 召回准确率——这是“保持上下文可靠”的关键技术。

例如,在金融、法律等专业领域,用户可能需要同时查询一个特定条款编号(关键词)及其相关概念(语义)。Hologres 能够在一次查询中完美满足此类需求,避免了在外部组件间进行两次查询并合并结果的复杂流程,从而保证了性能和准确性。这一能力也使 Hologres 的技术路线与主流向量数据库保持一致,证明了其设计的先进性与前瞻性。

Serverless 极致弹性:从容应对 Agent 的“潮汐流量”

第三大支柱是极致弹性与 Serverless,它专门应对 AI Agent 产生的“潮汐式”突发流量。AI Agent 的调用具有极强的不确定性和突发性,传统预留固定计算资源的模式要么造成大量闲置资源浪费,要么在高并发下导致系统宕机。Hologres 通过 Serverless Down to Zero 架构,实现了计算资源的按需秒级拉起和使用后自动缩容至零,真正做到了“为使用付费”。Hologres Serverless Computing 服务已于2024年7月正式上线并纳入 SLA(服务等级协议)保障,承诺不低于99.9%的服务可用性,极大地提升了企业在生产环境中采用 Serverless 模式的信心。这一特性对于承载企业核心业务的 Agent 至关重要,它不仅能带来显著的成本效益,更能确保系统的高可用性。Hologres 的存储计算分离架构(基于 Pangu 分布式文件系统)是实现这种极致弹性的技术前提,它允许计算节点灵活伸缩而不影响共享存储层的数据持久性和一致性。

负载强隔离:保障AI查询的确定性

第四大支柱是负载隔离与确定性保障,旨在消除 OLAP 分析对向量检索的“噪音”。向量检索任务对查询延迟的抖动(Jitter)极为敏感,而传统的 OLAP 重负载查询会占用大量 CPU 和内存资源,两者在同一系统中共存时极易相互干扰,导致 AI 应用的响应不稳定。Hologres 通过资源组强隔离机制,将“敏感的向量检索”与“重负载的分析查询”在物理或逻辑层面彻底解耦。Hologres V2.0 引入的虚拟仓库(Virtual Warehouse)实例为此提供了具体的工程实现路径,每个虚拟仓库都提供独立、可弹性伸缩的计算资源池,确保不同类型的工作负载互不干扰。这种隔离机制确保了即使在后台进行复杂的业务分析报表查询时,前端的 AI 应用依然能获得稳定如初的响应,从而保证了 Agent 的响应确定性,这是生产环境中部署任何 AI 应用的基本要求。

分析搜索混合处理,AI时代的统一数据平面

HSAP 2.0 的提出,标志着数据平台从“为人服务”转向“为 AI 服务”。它不是拼凑工具,而是基于对“数据熵 ”“Agent负载” “多模态融合” 等本质问题的洞察,重新定义了数据基础设施。

在 a16z 所预言的“智能体原生”(Agent-native)时代,企业需要的不是更多碎片化组件,而是一个可靠、低成本、高并发、强一致的统一数据平面。Hologres 所倡导的 HSAP 2.0 正致力于成为这一基础设施——让80%沉睡在非结构化数据中的企业知识,真正被AI激活。

想深入交流HSAP 2.0的技术细节或落地场景?

欢迎加入 Hologres 技术交流群,与产品、架构、解决方案专家直接对话!

(扫码入群 👇)

立即免费试用 Hologres HSAP 2.0

无需预付费用,按实际查询量付费,新用户还可享免费额度!

(新用户描述扫码领取 👇)

参考引用

  • [1] a16z《Big Ideas 2026》: https://a16z.com/newsletter/big-ideas-2026-part-1

  • [2] IDC《全球数据圈与非结构化数据价值洞察》(2024): https://my.idc.com/getdoc.jsp?containerId=prCHC52667624

  • [3] Hologres在阿里双十一流量高峰下处理每秒高达5.96亿条记录的经验:https://www.alibabacloud.com/blog/597880

  • VLDB 2020 论文《Hologres: A Cloud-Native Hybrid Serving/Analytical Processing Engine》: https://www.vldb.org/pvldb/vol13/p3337-jiang.pdf

  • 阿里云 Hologres 产品主页: https://www.aliyun.com/product/hologres

  • Hologres 向量检索能力文档: https://help.aliyun.com/document_detail/407552.html

  • Hologres Serverless 计算服务公告: https://help.aliyun.com/product/40692.html

  • Hologres MCP(Model Context Protocol)集成说明: https://help.aliyun.com/document_detail/2731967.html

【声明】内容源于网络
0
0
阿里云大数据AI平台
阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。
内容 623
粉丝 0
阿里云大数据AI平台 阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。
总阅读478
粉丝0
内容623