01
大语言模型常因知识局限而产生“幻觉”。检索增强生成(RAG)技术通过连接外部知识库,有效解决了这一痛点。要实现高效的 RAG,一个强大的向量数据库至关重要。本文将聚焦于业界领先的 Milvus,并借助低代码 AI 平台 Dify,向您展示如何将二者无缝结合,快速搭建一个企业级的 RAG 应用,直观感受向量数据库在解决 AI “最后一公里”问题上的核心价值。
阿里云 Milvus 基本原理介绍
基本原理与架构概述
Milvus 是专为向量相似性搜索设计的分布式数据库,其核心基于以下关键技术:
近似最近邻搜索(ANN):通过 HNSW、IVF、PQ 等算法实现高效向量检索,平衡精度与速度。
向量索引与查询分离:支持动态构建多种索引类型(如 FLAT、IVF_FLAT、IVF_PQ、HNSW),适配不同场景需求。
向量数据分片与分布式计算:数据水平切分(Sharding)并行处理,实现高吞吐与低延迟。
采用云原生和存算分离的微服务架构。该架构分为接入、协调、执行和存储四层。各组件可独立扩展,确保了系统的高性能、高可用性和弹性。它依赖成熟的第三方组件(如 etcd、对象存储)进行数据和元数据管理,稳定可靠。
阿里云 Milvus 系统架构图
使用场景
阿里云 Milvus 适用于任何需要进行“相似性”匹配的场景。其核心应用包括:
图像视频搜索:如电商平台的以图搜图、安防领域的人脸识别和视频轨迹追踪。
文本语义搜索:构建智能客服、企业内部文档知识库和代码搜索引擎,能精准理解用户意图,而非简单的关键词匹配。
个性化推荐系统:根据用户的行为和偏好向量,实时推荐最相似的商品、音乐、新闻或视频。
前沿科学与安全:在生物信息学中加速药物分子筛选,或在网络安全领域进行异常流量和欺诈行为检测。
智能驾驶数据准备与挖掘:对点云图像、车载传感器收集的音视频等多模态数据进行向量数据的实时查询。
Dify 平台介绍
Dify 是开源人工智能应用开发平台,具有低代码的工作流和友好的用户界面的特点,其核心使命是通过将“后端即服务”(Backend-as-a-Service)与“大语言模型运维”(LLMOps)的理念深度融合,来彻底简化和加速 AI 应用的构建全过程。
作为一个全栈式的解决方案,Dify 在后端层面,提供了稳定可靠的 API 服务、数据管理等基础设施,让开发者无需从零搭建;在 LLM 运维层面,提供了一个直观的可视化提示词编排界面,让复杂的提示工程变得简单高效。其内置的高质量检索增强生成(RAG)引擎,能够轻松连接企业文档、数据库等私有知识库,让大模型基于特定领域的知识进行回答,有效减少了信息幻觉,并确保答案的准确性和可追溯性。
02
前提条件
已创建阿里云 Milvus 实例。
具体操作,请参见快速创建 Milvus 实例 https://x.sm.cn/INSbdqp。
已开通百炼服务并获得 API-KEY。
具体操作,请参见开通 DashScope 并创建API-KEY https://x.sm.cn/3KK30nn。
已安装 Git、Docker、Docker-Compose。
具体操作请参见安装 Docker https://x.sm.cn/oS0RB9、安装 Git https://x.sm.cn/glEX9h。
Dify 安装与配置
安装 Dify
请通过 Git 命令将开源 Dify 项目从 GitHub 克隆至本地。
git clone https://github.com/langgenius/dify.git
进入目录备份.env 配置文件。
cd difycd dockercp .env.example .env
修改配置文件.env。
VECTOR_STORE=milvusMILVUS_URI=http://YOUR_ALIYUN_MILVUS_ENDPOINT:19530MILVUS_USER=YOUR_ALIYUN_MILVUS_USERMILVUS_PASSWORD=YOUR_ALIYUN_MILVUS_PASSWORD
注意
将 YOUR_ALIYUN_MILVUS_ENDPOINT 替换为您的阿里云 Milvus 公网地址。
将 YOUR_ALIYUN_MILVUS_USER 替换为您的阿里云 Milvus 用户。
将 YOUR_ALIYUN_MILVUS_PASSWORD 替换为您的阿里云 Milvus 密码。
启动 Dify。
docker compose up -d
安装成功验证
启动后访问部署的 Dify 服务 IP 地址 http://127.0.0.1/ 进入 Dify 的登陆页面,设置管理员账号密码,并登陆进管控台。
设置默认模型
登录成功后,单击右上角头像,下拉菜单中选择设置。
在设置--模型提供商处安装模型供应商,在这里我们选用了通义千问的模型,可以在百炼平台获取 API-KEY。安装后,将 API-KEY 输入,验证绿灯即可。
弹出的设置菜单中,选择左侧模型供应商,下拉选择通义千问,单击安装按钮安装模型。
模型安装成功后,选择设置 API-KEY,将提前准备好的百炼平台 API-KEY 输入。
系统模型设置可以参照以下设置。
验证绿灯即可。
准备数据集创建知识库
接下来准备测试数据来创建知识库。
单击上方知识库按钮,点击创建知识库。
数据源选择导入已有文本,您可以点此下载示例数据阿里云 Milvus 简介 https://x.sm.cn/DPjxqnr。
数据源参考如下配置,单击保存并处理。
可以看到数据库已经成功创建,并且索引创建完毕。
验证向量检索是否成功
通过 docker logs 查看,可以看到 dify 日志里显示上传成功。
也可以通过登录阿里云 Milvus 控制台 https://x.sm.cn/970ZFWE,选择您配置的 Milvus 实例,单击右上角 Attu Manager 进入 Attu 页面,可以看到对应的 collection 数据已导入。详情请参见 Attu 工具管理 https://x.sm.cn/JGSJ00T。
验证 RAG 效果
单击上方工作室回到首页,选择从应用模板中创建。
左侧菜单中选择 Knowledge Retrieval,使用 knowledge Retreival + Chatbot模板。
创建模板。
选择 Knowledge Retrieval 节点,知识库设置为上面步骤中创建的知识库。
选择 LLM 节点,将模型设置为 qwen-max。
单击右上角发布按钮,选择发布更新。
选择运行,进入测试页面,输入一个与知识库中内容相关的问题,即可获得答案。
同样,阿里云人工智能平台 PAI 支持在 Dify 工作流中调用推理服务 PAI-EAS 部署的模型。使用阿里云人工智能平台 PAI 作为云端大模型部署资源,开启稳定、高效的 AI 开发新体验。
具体操作步骤为:
1. 安装并启动 Dify;
2. 使用 PAI-Model Gallery 零代码部署模型,如通义千问最新 Think 模型:Qwen3-235B-A22B-Thinking-2507;
3. 返回 Dify 页面,配置 PAI 部署的模型调用地址等信息;
4. 执行完整 Dify 工作流。
03
我们诚邀您立即体验阿里云 Milvus 的强大功能!
免费试用:产品新用户可免费试用向量检索服务 Milvus 版入门 8 vCPU 32 GiB 1 个月和模型推理服务 PAI-EAS 500 元大模型部署额度(1个月内有效)。
领取地址:向量检索服务 Milvus 版 >> https://x.sm.cn/FXQT0f5;
人工智能平台 PAI >> https://free.aliyun.com/?productCode=learn。
年付5折:覆盖阿里云 Milvus 全规格产品。
节省计划:阿里云人工智能平台 PAI 预付活动低至3折,59可抵200、1080可抵1500、12000可抵15000,模型训练、部署等各阶段均适用,无机型和地域限制。
通用 RAG 超值套餐(PAI+Milvus ):https://x.sm.cn/7FTzgEj。
欢迎前往产品详情页购买体验!https://www.aliyun.com/product/milvus。
/ END /
更多推荐
如您对文中所提到的内容及产品有疑问,或者有明确的业务需求,可点击阅读原文填写表单联系我们,有专业的人员来联系您响应您的需求。




