Oracle AI向量搜索(Vector Search) 是一项新功能,除了数据库传统上支持的数据值(例如属性值或关键字)之外,它允许用户根据数据的语义或含义来搜索数据。
向量,或称向量嵌入,是AI应用中一种常用的数据结构。向量是由深度学习模型根据各种数据类型(例如图像、文档、视频等)生成的数字列表,用于对数据的语义进行编码。
Oracle AI Vector Search允许您充分利用SQL的强大功能,生成、存储、索引和查询向量嵌入以及其他业务数据。例如,对于文档搜索,向量搜索通常被认为比基于关键字的搜索更有效,因为向量搜索基于单词背后的含义和上下文,而不是实际的单词本身。
Oracle AI Vector Search允许您将语义文档搜索与结构化文档属性搜索相结合。例如,在技术文章数据库中,诸如“查找过去5年内由特定作者和特定出版商在特定国家/地区发布的关于针对企业用例微调大型语言模型 (LLM) 的文章”之类的问题,需要搜索文章文本以及可能存在于一个或多个表中的文章属性。
Oracle AI Vector Search包含一系列强大的功能,可实现针对业务用例的语义搜索。这些功能包括:
新的SQL运算符可从非结构化数据生成向量嵌入
用于存储向量嵌入的全新一级VECTOR数据类型
用于快速近似搜索的全新先进向量索引
新的SQL运算符和语法,可轻松表达业务查询中的相似性搜索
支持完整的生成式AI流水线,包括预处理和向量化数据,以及使用业务数据增强LLM
VECTOR数据类型已完全集成到SQL和PL/SQL中,并支持多种客户端和编程语言,并在python-oracledb、node-oracledb、JDBC 和 ODP.NET驱动程序中提供原生绑定功能。这种全面的支持可在多种开发环境中提供无缝的向量搜索功能。
Oracle AI Vector Search还完全集成到流行的第三方生成式AI框架中,例如LangChain。
Oracle AI Vector Search包含原生API,可通过REST调用 LLM API来生成内容(例如文本)或摘要,以及生成式AI (Generative-AI) 流水线中使用的其他操作。这些新功能无缝支持检索增强生成 (RAG),这是一种突破性的生成式AI技术,它利用私有业务数据增强大型语言模型 (LLM),从而针对业务数据上的自然语言问题提供准确的响应。
Benefits of Oracle AI Vector Search
Oracle数据库是优秀的运营和企业数据存储库。企业应用通常需要搜索业务数据和非结构化数据的组合。例如,零售网站可以基于自然语言产品描述和目标产品图片以及其他筛选条件(例如价格、商店位置、制造商和当前库存)进行搜索。此搜索需要同时搜索非结构化目录数据(产品描述和图片)、结构化目录数据(价格、商店位置和制造商)以及实时交易数据(例如当前库存)。
Oracle数据库和Oracle AI Vector Search融合功能的结合提供了多项优势。
Seamless Combination of AI Vector Data with Your Business Data
这是AI Vector Search的一大优势,因为它允许用户在现有Oracle数据库中运行AI驱动的向量相似性搜索,而无需将业务数据迁移到单独的向量数据库。避免数据移动可以降低复杂性、提高安全性,并支持对现有数据的搜索。
Oracle AI Vector Search允许比大多数专用向量数据库更强大的搜索,通过使用简单、直观的SQL和融合数据库的全部功能(JSON,图形,文本,关系,空间等),将复杂的业务数据搜索与AI向量相似性搜索相结合,所有这些都在单个查询中。
Powering Retrieval Augmented Generation with Business Data
向量数据库改进了与LLM的交互,因为它们为LLM提供了特定场景的私有上下文,从而获得更准确的答案。这个工作流程,称为检索增强生成 (RAG)。
Oracle AI Vector Search还充分利用业务数据的全部功能来进一步完善LLM交互,利用安全过滤器、业务指标和业务规则等业务标准,为企业提供超复杂的RAG。
Support for the Full Generative AI Pipeline for Business Data
Oracle AI Vector Search支持原生数据库 API 来执行生成式 AI 流水线的各个方面(从端到端),从而使您的开发人员可以更轻松地直接在Oracle数据库中使用您的业务数据构建下一代 AI 应用。
Unique Combination of AI Vector Search and Full Machine Learning Suite
Oracle数据库不仅提供全套数据库内机器学习算法,还提供基于AI向量的相似性搜索功能。这种组合使Oracle数据库能够处理涉及机器学习操作(决策、预测、分类、预报等)的广泛AI用例,还能利用基于AI的向量搜索功能。例如,可以轻松地在同一SQL查询中将推理和分类与AI Vector Search结合起来。
Proven, Enterprise-Class Scalability, Fault Tolerance and Security
Oracle数据库作为优秀的业务数据存储库,而业务数据与语义搜索的结合正是企业实施人工智能解决方案的必要条件。AI Vector Search内置于Oracle数据库中,并利用:
分区、RAC、Sharding 和 Exadata 经过验证的工业强度可扩展性。
Extreme HA和DR技术,如Data Guard、Golden Gate、Flashback、RMAN、ZDLRA 等。
Oracle Advanced Security的高安全性,包括透明数据加密、密钥库、审计库、虚拟专用数据库等功能。
Example Use Cases
Oracle AI Vector Search支持语义数据和业务数据的融合搜索,从而快速安全地获得更准确的答案。随着AI Vector Search加入Oracle数据库,用户可以快速轻松地获得人工智能的优势,无需牺牲安全性、数据完整性或性能。
用例包括:
对话式 AI或聊天机器人:构建人工智能数字助理
相似性搜索:将客户与产品进行匹配
基于内容的筛选:实现个性化推荐,通过图片定位零售商品
自然语言处理:文本分类和聚类SQL生成
数据分析:异常检测、模式识别
计算机视觉:人脸识别,生物识别,目标检测
生物医学研究:基因/DNA相似性研究、分子结构搜索
地理信息系统:空间分析、地图渲染
工业应用:质量控制、预测性维护、机械故障
Summary
Oracle AI Vector Search与Oracle Database结合,支持一类新型应用,通过使用增强了现有业务数据的LLM进行语义搜索,可以转变传统业务流程。
新的SQL运算符和语法使您能够轻松地将业务数据的关系搜索与非结构化数据的语义搜索结合起来
使用Oracle数据库进行AI向量相似性搜索 - 无需将业务数据移动到单独的向量数据库
轻松利用检索增强生成 (RAG) 来增强与企业特定内容的LLM响应
利用Oracle数据库的企业级安全性、可扩展性和分区功能增强您的应用
了解有关Oracle AI Vector Search的更多信息,请扫描下方二维码
Oracle Database 23ai线下课程
为帮助您快速掌握新特性与实战技巧,助力您成为AI时代的数据库管理专家,我们陆续推出了线下课程:
“Oracle AI应用全栈系列”线下课程-时间更新为5月14-16日 已结课
“Oracle AI应用全栈系列”上海线下课程 已结课
“Oracle AI应用全栈系列”上海线下课程-7月等你来!已结课
Oracle APEX零基础线下课程--7月北京见 已结课
“Oracle AI应用全栈系列”北京线下课程--相约金秋9月 已结课
Oracle Database 23ai管理专家培训 ——数据库专家的AI赋能快车道 已结课
Oracle Database 23ai管理专家培训 ——数据库专家的AI赋能快车道 2025年10月20-24日 北京 学员招募中
Oracle APEX企业级实战线下课程--11月SEE U in Beijing 2025年11月21-23日 学员招募中
欢迎您来Oracle一起探讨AI时代的数据库管理!

