知识库概述
知识库是大模型的第二大脑,主要用于解决大模型幻觉、专业知识不足等问题,能够有效提升大模型回答的准确率。
知识库类型
扣子支持使用扣子知识库和火山知识库,两者对应的分类方式不同。 •扣子知识库:分为文本类型、表格类型、图片类型的知识库。 •火山知识库:分为结构化和非结构化的知识库。 详细说明,请参考知识库类型。
本次课程主讲内容为扣子知识库
扣子知识库和火山知识库的对比
扣子知识库和火山知识库在功能上无明显差异,均能满足知识数据的存储、召回等需求。扣子知识库提供一定的存储空间免费额度,而火山知识库从上传文档并开始计费,因此你可以先通过扣子知识库体验知识库功能,如果需要更精细化的内容管理、更大的存储空间,再选择火山知识库。两者主要的区别如下:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
扣子知识库类型
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
使用限制
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
创建知识库
文本知识库
本地文档
1.填写知识库名称
2.上传文件
3.创建设置
4.分段预览
5.数据处理
6.处理完成
在线数据
1.填写知识库名称
2.新增URL
支持自动采集和手动采集,以下为功能对比
根据实际使用场景选择采集方式
自动采集
1.添加URL
添加方式支持:
• 添加单个
• 批量添加
更新频率支持:
• 不自动更新
• 每1天
• 每3天
• 每7天
• 每30天
支持新增、修改和删除
内容预览
2.创建设置
3.数据处理
4.处理完成
手动采集
1.安装浏览器插件和授权(首次使用)
2.添加URL
弹出了一个小窗口
支持捕获文字和列表
以采集文本为例
支持添加、修改、删除
3.创建设置
4.数据处理
5.处理完成
飞书
1.填写知识库名称
2.飞书授权(首次使用)
3.选择文件
4.创建设置
5.数据处理
6.处理完成
公众号
1.填写知识库名称
2.公众号授权
3.选择文件
受微信接口限制,仅支持导入发布时未开启“群发通知”的文章。功能比较鸡肋,暂时用不上,后续步骤略
Notion
1.填写知识库名称
2.Notion授权
3.授权页面
4.选择文件
5.创建设置
6.数据处理
7.处理完成
自定义 1.填写知识库名称
2.文本填写
3.创建设置
4.数据处理
5.处理完成
更多内容参考:https://www.coze.cn/open/docs/guides/create_knowledge
表格知识库
本地文档
1.填写知识库名称
2.上传文件
3.表结构配置
4.预览
5.数据处理
6.处理完成
API
用于从外部网站定期同步数据,需要搭建环境提供模拟数据,操作比较麻烦,配置过程略
飞书
1.填写知识库名称
2.选择文件
3.表结构配置
4.预览
5.数据处理
6.处理完成
自定义
1.填写知识库名称
2.新增知识库(索引不能配置多个,否则会报错)
3.添加内容,以自定义为例
4.添加内容
5.处理完成
索引添加多列的bug
更多内容参考:https://www.coze.cn/open/docs/guides/create_table_knowledge
图片知识库
1.填写知识库名称
2.上传图片
3.标注设置
最好选择人工标注,智能标注准确性太差。 4.数据处理
5.处理完成
6.图片打标 未标注的图片无法被召回检索
更多内容参考:https://www.coze.cn/open/docs/guides/create_image_knowledge
使用知识库
智能体
智能体概览
1.创建智能体
2.添加知识库
3.选择对应的知识库
4.编写人设与回复逻辑提示词
从知识库中检索用户输入的问题答案,如果没有答案,则回复“很抱歉,问题超出了我所掌握的范围,请联系人工客服”
5.调试智能体
6.配置开场白
开场白文案:你好,欢迎光临加油站,我将为你解答常见的问题。 开场白预置问题:建设加油站优惠是什么 7.发布智能体
8.发布成功
扩展:知识库的高级配置
对话流 对话流概览
1.创建智能体
2.切换为对话流模式
3.创建对话流
4.填写对话流信息
5.默认配置页面
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
7.试运行对话流
8.发布对话流
9.添加对话流
10.调试智能体
11.优化智能体
|
|
|
|---|---|
|
|
|
|
|
|
|
|
从用户输入的问答对中提取答案,仅输出答案,如果用户输入为空,则输出“很抱歉,问题超出了我所掌握的范围,请联系人工客服” |
|
|
|
12.更新对话流
13.调试智能体
14.配置开场白
开场白文案:你好,欢迎光临加油站,我将为你解答常见的问题。 开场白预置问题:建设加油站优惠是什么 15.发布智能体
知识库常见问题
1.分段有什么用 让知识库召回检索更精准 2.是不是上下文长度足够大就可以不分段了,直接全文档放上去 可以 3.知识库只按已有设置的设置的话,能满足多数需求吗? 大部分情况下,可以用默认参数;少数情况下,需要调整参数。 4.对话流和工作流的区别 参考:https://www.coze.cn/open/docs/guides/workflow_and_chatflow
更多内容参考:https://www.coze.cn/open/docs/guides/knowledge_faq







从用户输入的问答对中提取答案,仅输出答案,如果用户输入为空,则输出