大数跨境

0基础开发Coze智能体:第三章 知识库介绍及应用

0基础开发Coze智能体:第三章 知识库介绍及应用 数字人才实训基地
2026-01-04
15
导读:知识库概述知识库是大模型的第二大脑,主要用于解决大模型幻觉、专业知识不足等问题,能够有效提升大模型回答的准确

知识库概述

知识库是大模型的第二大脑,主要用于解决大模型幻觉、专业知识不足等问题,能够有效提升大模型回答的准确率。

知识库类型

扣子支持使用扣子知识库和火山知识库,两者对应的分类方式不同。 •扣子知识库:分为文本类型、表格类型、图片类型的知识库。 •火山知识库:分为结构化和非结构化的知识库。 详细说明,请参考知识库类型。

本次课程主讲内容为扣子知识库

扣子知识库和火山知识库的对比

扣子知识库和火山知识库在功能上无明显差异,均能满足知识数据的存储、召回等需求。扣子知识库提供一定的存储空间免费额度,而火山知识库从上传文档并开始计费,因此你可以先通过扣子知识库体验知识库功能,如果需要更精细化的内容管理、更大的存储空间,再选择火山知识库。两者主要的区别如下:

对比维度
扣子知识库
火山知识库
产品定位
扣子官方知识库,支持智能切片管理,适合轻量检索场景
火山引擎提供的企业级知识库服务,精细化切片管理,适合于企业客户场景
存储空间与性能
轻量级数据量及检索操作
相对扣子知识库,火山知识库支持更大的存储空间(例如单个知识库支持 300 万个文档数量)、更高的 QPS (单个知识库最高可支持 1 万 QPS)、更精细的切片管理(单个文档支持最大切片数 10 万个)和更复杂的文档处理需求,能够满足企业客户对于大规模知识库的存储需求。详细说明,请参考知识库配额说明
操作难度
其操作流程简单便捷,用户可以轻松上手
配置相对复杂、繁琐

扣子知识库类型

对比项
文本类型
表格类型
照片知识库
使用场景
文本知识库支持基于内容片段进行检索和召回,大模型结合召回的内容生成最终内容回复,适用于知识问答等场景
表格知识库支持基于索引列的匹配(表格按行进行划分),同时也支持基于 NL2SQL 的查询和计算。
照片知识库支持基于标注信息的匹配,适用于图像生成场景
导入方式
• 本地文档:从本地文件中导入文本内容,支持.txt、.pdf、doc、.docx 文件格式。
 • 在线数据:通过自动和手动方式采集指定网页的内容。
• 第三方渠道:从飞书文档和 Notion 文档中导入内容。
 • 自定义:手动输入要导入的文本内容。
• 本地文档:从本地文件中导入表格内容,支持.csv和.xlsx文件格式。
• 在线数据:通过 API 导入数据。
 • 第三方渠道:支持从飞书表格中导入数据。
• 自定义:手动输入要导入的表格数据。
本地图片:从本地文件中导入图片,支持JPG、JPEG和PNG图片格式。
内容分段
支持自动内容分段和手动分段方式
对于表格内容,默认按行分片,一行就是一个内容片段,不需要再进行分段设置
不涉及
索引
不涉及
扣子支持设置索引字段。用户输入的问题会与设置的索引字段内容对比,根据相似度匹配最相关的内容给大模型用于内容生成
扣子支持设置图片的标注信息。用户输入的问题会与设置的标注信息对比,根据相似度匹配最相关的图片给大模型用于内容生成

使用限制

资源
限制说明
知识库数量
• 单用户最多可创建 1000 个知识库。 
• 单个智能体最多可绑定 1000 个知识库。
知识库文件
• 文本知识库
    ○ 每个知识库下最多支持添加 300 个文件。 
    ○ 上传的每个文件大小不超过 100 MB。 
• 图片知识库
    ○ 每个知识库下最多支持添加 300 个文件。 
    ○ 上传的每个文件大小不超过 20 MB。
 • 表格知识库
    ○ 每个知识库下最多支持添加 300 个文件。 
    ○ 上传的每个文件大小不超过 20 MB。
    ○ 表格知识库中每个表格最多 50 列,10000 行。
知识库分段
• 每个文本类型知识库的分段总数最大为 10000 个。
 • 每个表格类型知识库的分段总数最多为 10000 行。
知识库容量
• 个人免费版套餐:知识库空间容量最大为 1 GB。
 • 个人进阶版套餐:知识库空间免费容量为 10 GB。
 • 团队版套餐:知识库空间免费容量为 100 GB。
 • 企业版套餐:知识库空间免费容量为 2 TB。
 • 在团队版或企业版套餐中,主账号及其所有企业团队成员共享知识库空间。
• 在个人进阶版、团队版和企业版中,当知识库空间的免费额度被用完时,系统支持自动扩容,超出部分按量计费。详细说明,请参考知识库空间。
内容
知识库中如果添加了邮箱地址、电话、姓名等可能涉及个人隐私的信息,智能体可能在某些渠道中使用受限,例如飞书渠道会屏蔽包含邮箱地址的智能体消息。
上传知识库
API 方式上传知识库时,表格类型 API 返回值最大支持 64KB。
火山知识库配额
火山知识库的文档数量、切片数量、CPU 配额、QPS 上限等配额数据,请参考知识库配额说明。

创建知识库

文本知识库

本地文档

1.填写知识库名称

2.上传文件

3.创建设置

4.分段预览

5.数据处理

6.处理完成

在线数据

1.填写知识库名称

2.新增URL

支持自动采集和手动采集,以下为功能对比

根据实际使用场景选择采集方式

自动采集

1.添加URL

添加方式支持:

• 添加单个

• 批量添加

更新频率支持:

• 不自动更新

• 每1天

• 每3天

• 每7天

• 每30天

支持新增、修改和删除

内容预览

2.创建设置

3.数据处理

4.处理完成

手动采集

1.安装浏览器插件和授权(首次使用)

2.添加URL

弹出了一个小窗口

支持捕获文字和列表

以采集文本为例

支持添加、修改、删除

3.创建设置

4.数据处理

5.处理完成

飞书

1.填写知识库名称

2.飞书授权(首次使用)

3.选择文件

4.创建设置

5.数据处理

6.处理完成

公众号

1.填写知识库名称

2.公众号授权

3.选择文件

受微信接口限制,仅支持导入发布时未开启“群发通知”的文章。功能比较鸡肋,暂时用不上,后续步骤略

Notion

1.填写知识库名称

2.Notion授权

3.授权页面

4.选择文件

5.创建设置

6.数据处理

7.处理完成

自定义 1.填写知识库名称

2.文本填写

3.创建设置

4.数据处理

5.处理完成

更多内容参考:https://www.coze.cn/open/docs/guides/create_knowledge

表格知识库

本地文档

1.填写知识库名称

2.上传文件

3.表结构配置

4.预览

5.数据处理

6.处理完成

API

用于从外部网站定期同步数据,需要搭建环境提供模拟数据,操作比较麻烦,配置过程略

飞书

1.填写知识库名称

2.选择文件

3.表结构配置

4.预览

5.数据处理

6.处理完成

自定义

1.填写知识库名称

2.新增知识库(索引不能配置多个,否则会报错)

3.添加内容,以自定义为例

4.添加内容

5.处理完成

索引添加多列的bug

更多内容参考:https://www.coze.cn/open/docs/guides/create_table_knowledge

图片知识库

1.填写知识库名称

2.上传图片

3.标注设置

最好选择人工标注,智能标注准确性太差。 4.数据处理

5.处理完成

6.图片打标 未标注的图片无法被召回检索

更多内容参考:https://www.coze.cn/open/docs/guides/create_image_knowledge

使用知识库

智能体

智能体概览

1.创建智能体

2.添加知识库

3.选择对应的知识库

4.编写人设与回复逻辑提示词

从知识库中检索用户输入的问题答案,如果没有答案,则回复“很抱歉,问题超出了我所掌握的范围,请联系人工客服”

5.调试智能体

6.配置开场白

开场白文案:你好,欢迎光临加油站,我将为你解答常见的问题。 开场白预置问题:建设加油站优惠是什么 7.发布智能体

8.发布成功

扩展:知识库的高级配置

对话流 对话流概览

1.创建智能体

2.切换为对话流模式

3.创建对话流

4.填写对话流信息

5.默认配置页面

节点
配置
开始节点
知识检索节点
结束节点

7.试运行对话流

8.发布对话流

9.添加对话流

10.调试智能体

11.优化智能体


节点
配置
开始节点
知识库检索节点
大模型节点
从用户输入的问答对中提取答案,仅输出答案,如果用户输入为空,则输出“很抱歉,问题超出了我所掌握的范围,请联系人工客服”
结束节点

12.更新对话流

13.调试智能体

14.配置开场白

开场白文案:你好,欢迎光临加油站,我将为你解答常见的问题。 开场白预置问题:建设加油站优惠是什么 15.发布智能体

知识库常见问题

1.分段有什么用 让知识库召回检索更精准 2.是不是上下文长度足够大就可以不分段了,直接全文档放上去 可以 3.知识库只按已有设置的设置的话,能满足多数需求吗? 大部分情况下,可以用默认参数;少数情况下,需要调整参数。 4.对话流和工作流的区别 参考:https://www.coze.cn/open/docs/guides/workflow_and_chatflow

更多内容参考:https://www.coze.cn/open/docs/guides/knowledge_faq

【声明】内容源于网络
0
0
数字人才实训基地
自动化办公、数据分析、人工智能、云计算等前沿数字化能力培养和实战
内容 45
粉丝 0
数字人才实训基地 自动化办公、数据分析、人工智能、云计算等前沿数字化能力培养和实战
总阅读250
粉丝0
内容45