在《数据库简史》书中,对行业发展进行了一个概括,以不同时代数据库技术的典型特征作为主线,分别定义了:商业数据库时代、开源数据库时代、云数据库时代。
今天应该可以说,数据库领域进入了“AI数据库时代”。
在数据技术的发展过程中,大数据的兴起将机器学习、人工智能导入到大数据范畴,Databricks是其中典型的代表。然而大模型(LLM)的兴起伴随向量计算为数据库带来了新的机遇,并且一发不可收。
AI为计算机的世界带来了无限机遇:氛围编程为数据库带来了新的伙伴,数据库的使用者中出现了“AI”,对话类AI需要即时计算和长期存储对话上下文,大模型为知识库类应用带来了新的生机……
在AI数据库领域探索的先行者,已经取得了史无前例的极速成功。
-
Neon创立4年即以10亿美元被Databricks收购;
-
Neon 和 Supabase 都是AI类应用的后端承接者。Snowflake也通过收购Crunchy Data来对抗这一变化。
2025年10月,Oracle宣布将其数据库名称变更为“Oracle AI Database”,吹响了从形式到内容的数据库AI化。
2025年11月,OceanBase宣布发布并开源其AI数据库seekdb,彰显了其对AI的态度。
如果为AI数据库给出一个定义,我觉得大体上应该是:AI数据库是一种专门设计的数据管理系统,旨在支持现代机器学习和人工智能应用,能够处理高维向量数据和结构化数据,原生支持混合搜索,可以高效存储、处理和分析多模态数据。
支持人工智能应用,这一句话的现实版本是千差万别,Supabase是通过BaaS服务赢得用户,Neon是通过分支闪回等创新特性。只要AI有无限多种可能性,数据库的创新也就允许百花齐放。在LLM发展的初期,向量数据库被认为是AI数据库,但是从长期看,向量只是AI的一角。完整的AI数据库一定多模态、混合搜索。向量融入关系。
在上周的直播中,我表达了对于Oracle AI数据库的一个Annotations小特性的观点。注解(Annotations)本质上是轻量级的声明式标记,以键值对或独立键的形式存在,存储在数据字典中。不要小看这个特性,如果从数据表创建开始,就辅助更清晰的注解描述,那么后期的数据治理就简单多了(数据治理融入数据模型),而AI能够更清晰的探索数据,给出更精准的答案。
数据治理曾经是非常艰难的一项工作,AI的加入,以及元数据能力的增强,会为数据治理找到一条新的路径。
上周看到Chat2DB团队发布的一个新产品(ZOER.AI)公告,感觉走对了路子,她们对数据库的认知非常精准,我抄录一段公告内容:
Zoer的核心思想是:“The Database-First Full Stack AI App Builder”(数据库优先的全栈 AI 应用构建器)。我们坚信,数据结构是应用的灵魂。Zoer 首先深入分析需求,优先设计和生成最核心的数据库 Schema。只有数据结构被精准定义,后续的业务逻辑和前端展示才有坚实的根基。在这个坚实的数据底座之上,才能智能地推导并生成。
Chat2DB团队曾经开发过NL2SQL的明星产品,她们应该是从中找到了灵感。如果SQL对数据一无所知或知之甚少,那么NL2SQL的探索也很难自由的支持用户的思想。反之,如果数据结构被清晰的定义和描述,那么NL2SQL的探索就可以一击必中。
而解决这一问题的思路既可以是外在的,也可以是内在的。Oracle的特性在做内在探索;而外在的探索也完全可以借鉴数据库的思路构建元数据描述。
路有千条,自始至终。
注:用Google Gemini 3做了2点插图,一次出图,还不错。
云和恩墨数据技术产品四件套,端到端解决企业数据技术应用的挑战。