大数跨境

重构搜索范式:阿里云 Elasticsearch 开启“Agent 原生”时代,打造企业级 AI 记忆湖

重构搜索范式:阿里云 Elasticsearch 开启“Agent 原生”时代,打造企业级 AI 记忆湖 阿里云大数据AI平台
2026-04-30
3
导读:阿里云 Elasticsearch 正在向“Agent 原生搜索”转型,以应对未来数据检索需求。通过重构搜索引擎架构,提供专为 Agent 设计的搜索体验与工具,提升搜索效率与效果。


导读/Overview

随着全球数据量在 2025 年达到 175ZB,且非结构化数据占比高达 80%,传统的关键词搜索已难以满足日益增长的跨模态检索与对话式交互需求。在 Agent(智能体)驱动的未来,搜索不再仅仅是信息的检索,更是 AI 决策的基石。近日,阿里云智能集团计算平台事业部 AI 搜索负责人邢少敏深入解析了阿里云 Elasticsearch 从“企业搜索”向“AI 搜索 Token 化”进阶的技术路径,正式提出“Agent 原生搜索”理念,旨在为技术决策者提供一套面向未来的、高性能、全模态的企业级 AI 搜索基础设施解决方案。



01

范式转移:从“为人搜索”到“为 Agent 搜索”

过去二十年,搜索引擎的设计核心始终围绕“人”展开:图形界面便于人阅读,结果列表便于人点击,Web 页面视觉呈现便于人浏览。但是现在 Agent 使用搜索引擎已经越来越普遍,搜索引擎已经成为各种 Agent 的标配,这种转变使得 Agent 单任务可自动触发数十次搜索,搜索调用次数指数级上升,Agent 对搜索的依赖越来越重,搜索引擎需要被重构以适应 Agent 的搜索需求。

随着大语言模型(LLM)与 Agent 技术的爆发,AI 工程方法也正在经历深刻的演进:

  • 2023-2024(Prompt Engineering):重点在于提示词是否准确,能不能把任务讲清楚,教模型“怎么思考”;

  • 2025(Context Engineering):重点转向 RAG 与向量检索,给模型“喂对信息”,确保上下文准确;

  • 2026(Harness Engineering):重点在于工具链、Skills、多 Agent 协调、运行环境等,给模型“套上缰绳”,驾驭模型正确处理复杂任务。

在这一背景下,阿里云 Elasticsearch 率先提出了“Agent 原生搜索”概念。与传统搜索不同,Agent 原生搜索专为 Agent 设计,提供 ES Skills 供 Agent 调用,返回 Agent 友好的 Markdown、Json 格式结果,而非供人类阅读的 HTML 页面。这一改变极大地提升了 Agent 搜索效率和搜索效果,进而提升了 Agent 整体效率与准确性。


02

核心架构:四大支柱构建 Agent 原生引擎

阿里云 Elasticsearch 通过四大核心模块,重新定义了云搜索产品的技术边界,实现了从底层引擎到上层应用的全栈升级。

 1. Agent 原生的搜索体验:重塑交互接口

阿里云 Elasticsearch 将实例管理、集群运维、健康诊断、监控告警等传统运维动作抽象为 Agent Skills。这意味着开发者可以通过自然语言描述需求,进行Elasticsearch的运维管理,极大降低了运维门槛和人为错误。

  • 面向 Agent 的结果:搜索结果不再是网页片段,而是结构化的 JSON 或 Markdown,可以直接作为 LLM 的输入上下文。

  • 可以被 Agent 集成:允许悟空、QoderWork、DataWorks Data Agent 以及开源社区如 OpenClaw、Hermes Agent 等各类 Agent 无缝集成。

 2. 统一的 Agent Builder 平台:降低开发门槛

为解决 Agent 开发碎片化问题,阿里云推出了 Elasticsearch Agent Builder。这是一个基于 Elasticsearch 的 Agent 构建平台。

  • 分钟级开发Agent:开发者可利用 Agent Builder,几分钟内创建出 Agent,分析 ES 中的数据。开发者可以结合 ES 领先的文本+向量混合检索能力,以及 ES|QL 强大的数据操作能力,构建高准确度、高相关性的专属 Agent。

  • 生态兼容:兼容 MCP 和 A2A 的接口,将企业数据安全的开放给整个 AI 生态系统,加速 Agent 的开发与部署。

 3. 全能力的 Agent 上下文引擎:精准的信息供给

Context(上下文)是 Agent 智能程度的关键。阿里云 Elasticsearch 提供了覆盖上下文工程全流程的能力:

  • 混合检索:支持文本、向量、混合检索及 Rerank(重排序),内置 Qwen 系列及第三方大模型,支持稠密/稀疏/多模态 Embedding。

  • 性能加速:引入 GPU 加速向量索引构建,索引吞吐提升 12 倍,Merge 速度提升 7 倍;采用 BBQ 极致向量量化技术,过滤速度提升 5 倍,DiskBBQ 实现海量数据低成本检索。

  • 工作流编排:内置提示词管理、Agent Skills 管理及知识库管理,支持复杂的多 Agent 工作流编排。

 4. 高性能引擎 FalconSeek:极致性能保障

针对企业级大规模数据场景,阿里云自研了高性能引擎 FalconSeek。实测数据显示,FalconSeek 目前线上 Query 覆盖率已经达到 90%,为客户集群带来 50%~300% 的性能提升。

  • 排序查询:最高提升 3.54 倍。

  • 聚合分析:最高提升 6.8 倍。

  • 向量查询(Filter-Knn):最高提升 4 倍。 这为海量数据下的实时 AI 搜索提供了保障,确保 Agent 高性能检索检索。


03

终极愿景:构建企业级“Agent 知识记忆湖”

当前,全球企业平均使用超过 30 个应用系统,中国企业也平均使用 11 个系统,数据孤岛现象严重。阿里云 Elasticsearch 提出的终极解决方案是构建“面向 Agent 的企业知识记忆湖”

该方案通过 Agentic Search 作为统一入口,打通 MaxCompute、SLS、RDS、Lindorm、钉钉文档等多源异构数据。它不仅存储数据,更通过“记忆提取”机制,将交互日志、反馈记录转化为记忆和 Skills 沉淀。

  • 记忆存储与沉淀:将非结构化、向量及结构化数据统一纳入知识湖,形成企业的长期记忆。

  • 多场景覆盖:基于统一的知识湖,可衍生出多模态检索 Agent、深度研究 Agent、数据分析 Agent 等多种应用场景,覆盖邮件、即时通讯、文档管理等各个企业场景。

  • 安全与权限:在实现数据互通的同时,保留细粒度的权限管理能力,确保企业数据安全。


04

结语

从倒排索引到向量检索,再到如今的 Agent 原生搜索,阿里云 Elasticsearch 正在完成从“搜索引擎”到“AI 搜索基础设施”的蜕变。对于技术决策者而言,选择阿里云 Elasticsearch 不仅意味着获得了高性能的检索引擎,更意味着获得了一套能够连接数据与智能、沉淀企业知识记忆、加速 Agent 应用落地的完整技术栈。

在 AI 2.0 时代,让数据成为 Agent 最可靠的记忆,让搜索成为智能最敏锐的触角,这正是阿里云 Elasticsearch 进阶之路的核心使命。

了解更多:

阿里云 Elasticsearch:https://www.aliyun.com/product/bigdata/elasticsearch

阿里云 AgenticSearch:https://help.aliyun.com/zh/open-search/search-platform/product-overview/agentic-search-ai-driven-next-generation-enterprise-search

欢迎钉钉扫码入群:

【声明】内容源于网络
0
0
阿里云大数据AI平台
阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。
内容 689
粉丝 0
阿里云大数据AI平台 阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。
总阅读2.2k
粉丝0
内容689