

超强组合！Dify+Milvus构建生产级RAG系统的终极指南

阿里云大数据AI平台

2025-07-30

导读：本文将聚焦于业界领先的Milvus，并借助低代码AI平台Dify，向您展示如何将二者无缝结合，快速搭建一个企业级的RAG应用。

原理介绍

大语言模型常因知识局限而产生“幻觉”。检索增强生成（RAG）技术通过连接外部知识库，有效解决了这一痛点。要实现高效的 RAG，一个强大的向量数据库至关重要。本文将聚焦于业界领先的 Milvus，并借助低代码 AI 平台 Dify，向您展示如何将二者无缝结合，快速搭建一个企业级的 RAG 应用，直观感受向量数据库在解决 AI “最后一公里”问题上的核心价值。

阿里云 Milvus 基本原理介绍

基本原理与架构概述

Milvus 是专为向量相似性搜索设计的分布式数据库，其核心基于以下关键技术：

近似最近邻搜索（ANN）：通过 HNSW、IVF、PQ 等算法实现高效向量检索，平衡精度与速度。
向量索引与查询分离：支持动态构建多种索引类型（如 FLAT、IVF_FLAT、IVF_PQ、HNSW），适配不同场景需求。
向量数据分片与分布式计算：数据水平切分（Sharding）并行处理，实现高吞吐与低延迟。

采用云原生和存算分离的微服务架构。该架构分为接入、协调、执行和存储四层。各组件可独立扩展，确保了系统的高性能、高可用性和弹性。它依赖成熟的第三方组件（如 etcd、对象存储）进行数据和元数据管理，稳定可靠。

阿里云 Milvus 系统架构图

使用场景

阿里云 Milvus 适用于任何需要进行“相似性”匹配的场景。其核心应用包括：

图像视频搜索：如电商平台的以图搜图、安防领域的人脸识别和视频轨迹追踪。

文本语义搜索：构建智能客服、企业内部文档知识库和代码搜索引擎，能精准理解用户意图，而非简单的关键词匹配。

个性化推荐系统：根据用户的行为和偏好向量，实时推荐最相似的商品、音乐、新闻或视频。

前沿科学与安全：在生物信息学中加速药物分子筛选，或在网络安全领域进行异常流量和欺诈行为检测。

智能驾驶数据准备与挖掘：对点云图像、车载传感器收集的音视频等多模态数据进行向量数据的实时查询。

Dify 平台介绍

Dify 是开源人工智能应用开发平台，具有低代码的工作流和友好的用户界面的特点，其核心使命是通过将“后端即服务”（Backend-as-a-Service）与“大语言模型运维”（LLMOps）的理念深度融合，来彻底简化和加速 AI 应用的构建全过程。

作为一个全栈式的解决方案，Dify 在后端层面，提供了稳定可靠的 API 服务、数据管理等基础设施，让开发者无需从零搭建；在 LLM 运维层面，提供了一个直观的可视化提示词编排界面，让复杂的提示工程变得简单高效。其内置的高质量检索增强生成（RAG）引擎，能够轻松连接企业文档、数据库等私有知识库，让大模型基于特定领域的知识进行回答，有效减少了信息幻觉，并确保答案的准确性和可追溯性。

操作步骤

前提条件

已创建阿里云 Milvus 实例。
具体操作，请参见快速创建 Milvus 实例 https://x.sm.cn/INSbdqp。

已开通百炼服务并获得 API-KEY。
具体操作，请参见开通 DashScope 并创建API-KEY https://x.sm.cn/3KK30nn。
已安装 Git、Docker、Docker-Compose。
具体操作请参见安装 Docker https://x.sm.cn/oS0RB9、安装 Git https://x.sm.cn/glEX9h。

Dify 安装与配置

安装 Dify

请通过 Git 命令将开源 Dify 项目从 GitHub 克隆至本地。

git clone https://github.com/langgenius/dify.git

进入目录备份.env 配置文件。

cd difycd dockercp .env.example .env

修改配置文件.env。

VECTOR_STORE=milvusMILVUS_URI=http://YOUR_ALIYUN_MILVUS_ENDPOINT:19530MILVUS_USER=YOUR_ALIYUN_MILVUS_USERMILVUS_PASSWORD=YOUR_ALIYUN_MILVUS_PASSWORD

注意

将 YOUR_ALIYUN_MILVUS_ENDPOINT 替换为您的阿里云 Milvus 公网地址。
将 YOUR_ALIYUN_MILVUS_USER 替换为您的阿里云 Milvus 用户。
将 YOUR_ALIYUN_MILVUS_PASSWORD 替换为您的阿里云 Milvus 密码。

启动 Dify。

docker compose up -d

安装成功验证

启动后访问部署的 Dify 服务 IP 地址 http://127.0.0.1/ 进入 Dify 的登陆页面，设置管理员账号密码，并登陆进管控台。

设置默认模型

登录成功后，单击右上角头像，下拉菜单中选择设置。

在设置--模型提供商处安装模型供应商，在这里我们选用了通义千问的模型，可以在百炼平台获取 API-KEY。安装后，将 API-KEY 输入，验证绿灯即可。

弹出的设置菜单中，选择左侧模型供应商，下拉选择通义千问，单击安装按钮安装模型。

模型安装成功后，选择设置 API-KEY，将提前准备好的百炼平台 API-KEY 输入。

系统模型设置可以参照以下设置。

验证绿灯即可。

准备数据集创建知识库

接下来准备测试数据来创建知识库。

单击上方知识库按钮，点击创建知识库。

数据源选择导入已有文本，您可以点此下载示例数据阿里云 Milvus 简介 https://x.sm.cn/DPjxqnr。

数据源参考如下配置，单击保存并处理。

可以看到数据库已经成功创建，并且索引创建完毕。

验证向量检索是否成功

通过 docker logs 查看，可以看到 dify 日志里显示上传成功。

也可以通过登录阿里云 Milvus 控制台 https://x.sm.cn/970ZFWE，选择您配置的 Milvus 实例，单击右上角 Attu Manager 进入 Attu 页面，可以看到对应的 collection 数据已导入。详情请参见 Attu 工具管理 https://x.sm.cn/JGSJ00T。