大数跨境
0
0

使用 NVIDIA GPU 加速 Oracle Database 23ai 中的 AI 向量搜索

使用 NVIDIA GPU 加速 Oracle Database 23ai 中的 AI 向量搜索 Oracle职业发展力计划
2025-10-16
0

多年来,Oracle 数据库不仅支持众多新数据类型和工作负载(包括 JSON、图形、空间、内存、区块链和向量),还充分利用了先进的硬件,这证明了其多功能性。如今,我们在集成系统和云中充分利用了尖端的 CPU 技术。那么 GPU 呢?它们是如何与 Oracle 数据库契合的?


在拉斯维加斯举行的 Oracle CloudWorld 2024 上,我们展示了 Oracle 数据库的两项 GPU 加速功能,它们利用 NVIDIA GPU 加速 Oracle Database 23ai 中的 AI 向量搜索功能。


第一个功能是通过 GPU 加速从各种不同的输入数据集(例如文本、图像、视频等)创建向量嵌入。向量嵌入创建是 AI 向量搜索的必要的第一步,此功能有助于对大量输入数据进行高效的批量向量化。


第二个是早期概念验证,演示了如何使用 GPU 加速 Oracle 数据库中向量索引的创建和维护。向量索引创建是 AI 向量搜索的第二步,快速创建和维护向量索引对于支持海量 AI 向量工作负载至关重要。


这两项功能都表明,除了在 CPU 上运行整个 AI 向量搜索流水线之外,GPU 还可以与 CPU 协同工作,加速向量搜索工作负载中计算密集的部分,从而展示这些领域性能改进的潜力。


Oracle公司关键任务数据库技术执行副总裁 Juan Loaiza 表示:“我们一直在寻找能够惠及 Oracle 数据库用户的新兴软件和硬件技术。向量搜索的演进以及使用 GPU 加速工作流程中计算密集的部分,展示了这些技术如何协同工作,从而帮助满足客户的需求。通过与 NVIDIA GPU 合作,我们能够在 Oracle CloudWorld 大会上展示全新 AI 向量搜索功能的性能提升。”


NVIDIA 首席技术官 Michael Kagan 表示:“通过NVIDIA AI 工具, Oracle 数据库用户能够灵活地在需要的地方使用 GPU。嵌入生成和向量搜索索引创建是向量数据库(例如 Oracle 数据库)所需的两项重要任务。借助 GPU 加速的 AI 向量搜索,Oracle 数据库用户可以显著提升其 AI 工作流的性能。”


增加 Oracle 数据库的向量搜索功能性能


GPU 为专门的计算密集型用例提供优秀的内存带宽和计算能力。它们不会取代用于传统数据库工作负载(例如 OLTP 或传统分析)的通用 CPU。但是,它们可以帮助加速涉及“密集计算”的操作,包括涉及对同一内存驻留数据进行多遍计算的常见 AI 和机器学习 (ML) 操作。


Oracle Database 23ai 中的 AI 向量搜索功能利用 AI 技术,支持对非结构化和结构化业务数据进行智能搜索。它包括使用 Oracle Database 内部 CPU 运行导入的 ONNX 模型的功能、用于存储向量嵌入的全新 VECTOR 数据类型、用于近似近邻 (ANN) 搜索的全新 VECTOR 索引,以及用于 Oracle Database 原生搜索功能的新 SQL 运算符。我们通过实施 SIMD 优化的向量距离内核和先进的近似搜索索引,优化了向量搜索工作负载,这些内核利用现代 CPU 平台(例如 Exadata 存储服务器)的全部内存带宽和多核并行性。即使在顶格利用基于 CPU 的处理优势之后,向量工作负载的某些方面(包括生成向量嵌入和创建向量索引)也可以从 GPU 加速中受益。


使用 OCI 的 NVIDIA GPU 加速实例为 Oracle Database 23ai 生成向量嵌入


向量嵌入是复杂内容(例如图像、文本或复杂业务对象)的数学表示,由名为“嵌入模型”的深度学习模型生成。在 Oracle 数据库中,向量是通过对数据库内部或外部的数据运行嵌入模型来创建的,这些模型可以在数据库内部或外部运行。生成的向量随后存储在数据库的 VECTOR 列中。

我们的首个演示将于 Oracle CloudWorld 上正式发布,我们将展示如何通过 Oracle 自治数据库 -- 无服务器版中的 Oracle 机器学习 (OML) Notebooks 集成访问 NVIDIA GPU,从而生成向量嵌入。此功能允许用户利用 OML Notebooks 中的 Python 解释器(自治数据库的一项重要功能)将数据库表中的数据加载到支持 Notebook Python 解释器的 GPU 虚拟机中,在 GPU 实例上生成向量嵌入,并将这些向量存储在 Oracle 数据库中,以便使用 AI 向量搜索进行搜索。GPU 实例的预配将自动为用户完成,并使用 Oracle 机器学习 Python 函数在数据库和 GPU 加速VM间传输数据。


在 GPU 上生成 Oracle Database 23ai VECTOR 索引


向量索引在向量数据的近似搜索中起着至关重要的作用。构建这些索引需要大量计算且耗时。此外,随着数据更新或新数据的加载,向量索引必须定期维护和刷新(甚至重新填充)。


在 Oracle CloudWorld 的本次概念验证演示中,我们将展示 Oracle Database 23ai 与 NVIDIA GPU 的集成,以创建名为 HNSW(分层可导航小世界)的内存图索引类型。演示重点介绍了 Oracle 开发的全新计算卸载框架如何使 Oracle Database 能够透明地将复杂的向量索引创建任务委托给配备强大 GPU 的外部服务器,从而在保持简单性的同时提升性能。


当用户向 Oracle 数据库发送创建 HNSW 向量索引的请求时,数据库会智能地编译该任务,并将其连同必要的向量数据一起重定向到一个新的计算卸载服务器进程。该服务器进程利用 GPU 的计算能力,并采用 CAGRA 算法(RAPIDS cuVS 库的一部分)快速生成图索引。CAGRA 索引创建完成后,会自动高效地传输回 Oracle 数据库实例,并在那里转换为 HNSW 图索引。最终的 HNSW 索引可供 Oracle 数据库实例中的后续向量搜索操作使用。

这种创新方法将 Oracle 数据库丰富的融合数据管理功能与 GPU 的原始计算能力相结合。通过将 GPU 加速无缝集成到数据库中,并将计算密集型的索引创建任务卸载到专用硬件上,我们可以明显提升处理速度和效率,同时保持 Oracle 数据库用户期望的易用性和可靠性。

Conclusion

这两个 GPU 加速演示展示了使用 GPU 处理 AI 向量搜索流程中计算密集型部分的潜力。敬请期待 Oracle 与 NVIDIA 此次合作的更多精彩进展。


了解更多信息,请访问

AI Vector Search 网页

AI Vector Search用户指南

AI解决方案中心

免费试用 Oracle Database 23ai

如需了解更多,请联系我们的客服平台,我们将尽全力给予您帮助和支持:


服务平台热线:

手机拨打 400 919 9696转3或4

邮箱:

OUChina_CN@oracle.com

【声明】内容源于网络
0
0
Oracle职业发展力计划
查询官方授权Oracle培训合作机构信息,获得Oracle最新认证资讯及IT前沿信息!
内容 35
粉丝 0
Oracle职业发展力计划 查询官方授权Oracle培训合作机构信息,获得Oracle最新认证资讯及IT前沿信息!
总阅读9
粉丝0
内容35