Day 5 / 7

知识库

上传文档资料,让Bot具备专业领域知识

📖 预计阅读时间:65分钟🎯 难度:中级

前面四天,我们学会了创建 Bot、使用插件、设计工作流。但你有没有发现一个问题:Bot 只能基于通用知识回答,对于你的专业领域、公司业务、产品细节,它一无所知。这时候就需要知识库(Knowledge Base)——给 Bot 喂入专属资料,让它成为你的领域专家。

一、什么是知识库

1.1 知识库的作用

知识库就像给 Bot 配备了一个"专业资料库"。当用户提问时,Bot 会先在知识库中搜索相关内容,然后基于这些资料生成回答。

对比示例:客服 Bot

❌ 没有知识库

用户:"你们的退货政策是什么?"

Bot:"一般来说,退货政策包括..."(泛泛而谈,不准确)

问题:回答不准确,可能误导用户

✅ 有知识库

用户:"你们的退货政策是什么?"

Bot:"根据我们的退货政策,购买后7天内可无理由退货,需保持商品完好..."(精准引用公司政策)

优势:准确、专业、可信

1.2 知识库的工作原理

1

上传资料

将文档、网页、FAQ 等资料上传到 Coze

2

自动分块和向量化

Coze 将文档切分成小段,转换为向量(数字表示)

3

用户提问

用户向 Bot 提问

4

语义搜索

Bot 在知识库中搜索与问题最相关的内容(不是关键词匹配,而是语义理解)

5

生成回答

Bot 基于检索到的内容,结合 LLM 生成准确的回答

💡 关键概念:语义搜索

传统搜索靠关键词匹配,语义搜索靠"理解意思"。

示例:

用户问:"怎么申请退款?"

知识库中没有"申请退款"这个词,但有"退货流程"、"退款政策"

语义搜索能理解这些内容都与用户问题相关,并返回正确答案

二、知识库的类型

Coze 支持多种类型的知识来源,可以根据需求选择。

2.1 文档类型

本地文档

常用

上传本地文件,支持多种格式。

支持格式:

• PDF、Word(.docx)、Excel(.xlsx)

• TXT、Markdown(.md)

• PPT(.pptx)

适用场景:

产品手册、操作指南、FAQ文档、培训资料

在线网页

常用

输入网页 URL,Coze 自动抓取内容。

支持方式:

• 单个网页 URL

• 批量导入多个 URL

• 自动爬取整个网站(需配置)

适用场景:

官网内容、博客文章、帮助中心、在线文档

结构化数据

高级

以表格形式组织的问答对或数据。

格式:

• CSV、Excel 表格

• 问题-答案对(Q&A)

适用场景:

FAQ、产品参数表、价格表、联系方式

API 数据源

高级

连接外部数据库或 API,实时获取数据。

支持方式:

• REST API 接口

• 数据库连接(需配置)

适用场景:

实时库存、订单状态、用户信息、动态内容

2.2 如何选择知识库类型

📄 内容固定、更新不频繁 → 本地文档

例如:产品说明书、公司介绍、操作手册

🌐 内容在线、需要定期同步 → 在线网页

例如:官网内容、博客文章、帮助中心

❓ 问答形式、结构清晰 → 结构化数据

例如:FAQ、常见问题、产品参数对比

🔄 数据实时变化 → API 数据源

例如:库存查询、订单状态、用户余额

三、创建和管理知识库

3.1 创建知识库(完整流程)

1️⃣进入知识库管理

• 在 Coze 工作台,点击左侧菜单"知识库"

• 点击"创建知识库"按钮

2️⃣基础配置

知识库名称

起一个清晰的名字,如"产品FAQ"、"操作手册"

描述(可选)

说明这个知识库包含什么内容,方便后续管理

分块策略

选择如何切分文档:

  • • 自动分块(推荐):Coze 自动按段落切分
  • • 固定长度:每 N 个字符切一块
  • • 按标题:按文档标题层级切分

3️⃣上传内容

方式一:上传文件

点击"上传文件",选择本地文档

支持批量上传,单个文件最大 10MB

方式二:输入网页 URL

粘贴网页链接,Coze 自动抓取内容

可以批量导入多个 URL

方式三:手动输入

直接在编辑器中输入文本内容

适合少量内容或临时添加

4️⃣处理和索引

• 上传后,Coze 会自动处理文档(分块、向量化)

• 处理时间取决于文档大小,通常几秒到几分钟

• 处理完成后,状态显示为"已索引"

5️⃣关联到 Bot

• 进入 Bot 编辑页面

• 在"知识库"选项卡,点击"添加知识库"

• 选择刚创建的知识库,保存

💡 一个 Bot 可以关联多个知识库

3.2 知识库管理

更新内容

  • 添加新文档:随时上传新文件或 URL
  • 删除文档:选中文档,点击删除
  • 重新索引:修改文档后,点击"重新索引"更新

测试知识库

在知识库页面,有"测试"功能,可以输入问题,查看检索结果。

测试内容:

• 输入问题,查看返回了哪些相关片段

• 检查相关性评分(0-1,越高越相关)

• 调整检索参数,优化结果

版本管理

Coze 会保存知识库的历史版本,可以回滚到之前的状态。

四、知识库配置与优化

4.1 检索参数配置

在 Bot 的知识库设置中,可以调整检索参数,影响搜索结果的质量和数量。

Top K(返回结果数量)

检索时返回最相关的 K 个片段。

• 默认值:3-5

• 太小:可能遗漏重要信息

• 太大:引入不相关内容,影响回答质量

💡 建议:从 3 开始,根据效果调整

相似度阈值

只返回相似度高于阈值的片段(0-1)。

• 默认值:0.7

• 阈值高:结果更精准,但可能找不到答案

• 阈值低:结果更多,但可能不相关

💡 建议:0.6-0.8 之间

检索模式

选择检索策略。

语义检索:基于语义理解(推荐)

关键词检索:基于关键词匹配

混合检索:结合两种方式

💡 建议:优先使用语义检索

4.2 内容质量优化

💡 提升知识库效果的技巧

1.

内容结构化

使用清晰的标题、段落、列表,避免大段文字堆砌

2.

避免重复内容

相同或相似的内容会干扰检索,删除冗余文档

3.

使用问答格式

对于 FAQ,用"问题:... 答案:..."格式,检索效果更好

4.

定期更新

及时删除过时内容,添加新资料

5.

控制文档大小

单个文档不要太大(建议小于 5MB),太大会影响处理速度

4.3 提示词优化

在 Bot 的提示词中,明确说明如何使用知识库,可以提升回答质量。

推荐提示词模板:

你是一个专业的客服助手。

## 知识库使用规则

1. 优先使用知识库中的信息回答问题
2. 如果知识库中有相关内容,直接引用,不要自己编造
3. 如果知识库中没有相关信息,明确告知用户:"抱歉,我的知识库中暂时没有这方面的信息"
4. 回答时保持专业、准确、友好

## 回答格式

- 简洁明了,避免冗长
- 如果是步骤类问题,用列表展示
- 必要时提供相关链接或联系方式

4.4 知识库高级技巧

技巧1:多知识库组合使用

一个 Bot 可以关联多个知识库,按优先级检索。

应用场景:

• 知识库1:最新产品信息(优先级高)

• 知识库2:历史产品资料(优先级中)

• 知识库3:通用FAQ(优先级低)

💡 Bot 会先在优先级高的知识库中搜索,找不到再搜索下一个

技巧2:知识库分片策略

对于大型文档,合理的分片策略能提升检索效果。

按章节分片(推荐)

适合结构化文档,每个章节独立成片

固定长度分片

适合无明显结构的长文本,每 500-1000 字一片

语义分片(智能)

AI 自动识别语义边界,保持内容完整性

技巧3:元数据标注

给文档添加元数据(标签、分类、时间),方便过滤和管理。

示例:

• 标签:产品A、售后、2024年

• 分类:技术文档、用户手册、FAQ

• 优先级:高、中、低

💡 检索时可以按元数据过滤,提高精准度

技巧4:知识库版本控制

为不同版本的产品维护独立的知识库。

• 产品 v1.0 知识库

• 产品 v2.0 知识库

• 产品 v3.0 知识库(当前版本)

💡 用户提问时,Bot 可以根据版本号选择对应知识库

技巧5:知识库与工作流结合

在工作流中灵活使用知识库,实现更复杂的逻辑。

示例流程:

1. 用户提问 → 检索知识库

2. 如果找到答案 → 直接返回

3. 如果没找到 → 调用搜索插件

4. 搜索结果 + LLM 生成答案

5. 将新答案添加到知识库(自动学习)

五、实战案例

5.1 案例一:产品客服 Bot

场景

为电商平台创建客服 Bot,回答产品相关问题。

知识库准备

1. 产品信息库

  • • 上传产品说明书(PDF)
  • • 导入产品参数表(Excel)
  • • 添加产品详情页 URL

2. FAQ 库

  • • 整理常见问题和答案(CSV)
  • • 包含:退换货、物流、支付等

3. 政策文档

  • • 上传退货政策、隐私政策(Word)

配置要点

• Top K: 5(返回5个相关片段)

• 相似度阈值: 0.7

• 检索模式: 语义检索

效果

👤

这款手机支持5G吗?

🤖

是的,这款手机支持5G网络。根据产品参数,它支持 SA/NSA 双模5G,覆盖 n1/n3/n41/n78/n79 等主流频段。

更多对话示例

示例2:退货咨询

👤

买了不喜欢可以退吗?

🤖

可以的。根据我们的退货政策,购买后7天内可无理由退货,需要满足以下条件:
1. 商品保持完好,包装完整
2. 配件齐全
3. 未激活使用
退货运费由买家承担,退款将在收到商品后3-5个工作日内原路退回。

示例3:物流查询

👤

一般多久能发货?

🤖

根据我们的发货政策:
• 现货商品:付款后24小时内发货
• 预售商品:按预售页面标注的时间发货
• 定制商品:7-15个工作日发货
发货后会通过短信和APP通知您物流单号。

5.2 案例二:企业内部知识助手

场景

为公司员工创建内部知识助手,快速查询公司制度、流程、文档。

知识库准备

1. 制度文档

  • • 员工手册、考勤制度、报销流程

2. 技术文档

  • • 开发规范、API 文档、部署指南

3. 项目资料

  • • 项目文档、会议纪要、需求文档

特色功能

  • • 支持多知识库:按部门或主题分类
  • • 权限控制:不同员工访问不同知识库
  • • 定期同步:自动从企业网盘同步最新文档

5.3 案例三:学习辅导 Bot

场景

为在线课程创建学习助手,回答课程相关问题。

知识库准备

1. 课程资料

  • • 课程讲义(PDF)
  • • 课程视频字幕(TXT)

2. 练习题库

  • • 习题和答案(Excel)

3. 参考资料

  • • 相关书籍章节、在线文档

使用效果

  • • 学生可以随时提问,获得即时解答
  • • 减轻老师答疑压力
  • • 24小时在线,不受时间限制

六、知识库效果评估

上线知识库后,需要定期评估效果,持续优化。

6.1 评估指标

1. 检索准确率

Bot 检索到的内容是否与用户问题相关。

评估方法:

• 随机抽取 50-100 个对话

• 人工判断检索结果是否相关

• 计算准确率 = 相关结果数 / 总结果数

目标:准确率 > 80%

2. 回答完整度

Bot 的回答是否完整解决了用户问题。

评估方法:

• 查看用户是否追问

• 统计一次性解决率

• 收集用户反馈(满意/不满意)

目标:一次性解决率 > 70%

3. 知识覆盖率

知识库能覆盖多少用户问题。

评估方法:

• 统计"知识库中没有相关信息"的回复次数

• 分析高频未覆盖问题

• 计算覆盖率 = 有答案的问题数 / 总问题数

目标:覆盖率 > 85%

4. 响应速度

Bot 检索知识库并生成回答的时间。

评估方法:

• 记录每次对话的响应时间

• 计算平均响应时间

• 分析慢查询原因

目标:平均响应时间 < 3秒

6.2 优化方向

根据评估结果优化

准确率低 → 优化内容质量

  • • 删除不相关或过时的文档
  • • 改进文档结构,使用清晰的标题和段落
  • • 调整分块策略

完整度低 → 补充内容

  • • 分析用户追问的内容,补充到知识库
  • • 增加更详细的说明和示例
  • • 优化提示词,引导 Bot 给出更完整的回答

覆盖率低 → 扩充知识库

  • • 收集高频未覆盖问题
  • • 编写对应的文档或FAQ
  • • 添加到知识库

响应慢 → 性能优化

  • • 减小文档大小
  • • 降低 Top K 值
  • • 使用更快的检索模式

6.3 持续改进流程

1

每周数据回顾

查看本周的对话记录,统计关键指标

2

识别问题

找出回答不准确、不完整、未覆盖的问题

3

更新知识库

补充缺失内容,修正错误信息,删除过时文档

4

测试验证

用之前的问题重新测试,确认改进效果

5

记录改进

记录本次改进的内容和效果,形成知识积累

七、常见问题

Q1: Bot 没有使用知识库内容怎么办?

可能的原因:

  • • 知识库没有关联到 Bot
  • • 知识库中没有相关内容
  • • 相似度阈值设置太高
  • • 提示词中没有引导使用知识库

解决方案:

  • • 检查知识库是否已关联
  • • 用测试功能验证知识库内容
  • • 降低相似度阈值(如 0.6)
  • • 在提示词中明确要求使用知识库

Q2: Bot 回答不准确,引用错误内容?

可能的原因:

  • • 知识库中有重复或矛盾的内容
  • • Top K 设置太大,引入不相关内容
  • • 文档分块不合理

解决方案:

  • • 清理知识库,删除重复内容
  • • 减小 Top K(如从 5 降到 3)
  • • 调整分块策略,重新索引

Q3: 知识库可以存储多少内容?

Coze 对知识库容量有限制,具体取决于你的套餐:

  • • 免费版:通常 10-50MB
  • • 付费版:100MB - 1GB+

建议:定期清理不常用的文档,保持知识库精简。

Q4: 知识库更新后,Bot 多久生效?

添加或删除文档后,需要重新索引,通常几秒到几分钟。索引完成后立即生效。

💡 提示:可以在知识库页面查看索引状态。

八、最佳实践

1. 知识库分类管理

不要把所有内容放在一个知识库,按主题或用途分类:

  • • 产品知识库:产品信息、参数、使用说明
  • • 服务知识库:FAQ、政策、流程
  • • 技术知识库:API 文档、开发指南

2. 定期维护

  • • 每月检查一次,删除过时内容
  • • 及时添加新资料
  • • 根据用户反馈优化内容

3. 监控效果

定期查看 Bot 的对话记录,分析:

  • • 哪些问题 Bot 回答得好
  • • 哪些问题 Bot 答不上来(补充知识库)
  • • 哪些内容被频繁检索(优化排序)

4. 结合工作流

知识库 + 工作流 = 更强大的 Bot。例如:先检索知识库,如果没找到答案,再调用搜索插件。

总结

今天我们学习了 Coze 的知识库功能。知识库让 Bot 从"通用助手"升级为"领域专家",能够基于你的专属资料提供准确、专业的回答。

关键要点:

  • • 知识库通过语义搜索,理解用户问题并返回相关内容
  • • 支持多种类型:本地文档、在线网页、结构化数据、API 数据源
  • • 创建流程:上传内容 → 自动索引 → 关联到 Bot
  • • 优化技巧:内容结构化、避免重复、定期更新、调整检索参数
  • • 实战应用:客服 Bot、企业知识助手、学习辅导 Bot

下一章预告

Day 6 我们将学习多轮对话功能。如何让 Bot 记住上下文,实现连贯的对话体验,打造真正智能的对话系统。

遇到问题?

加入云途AGI社群,获取配套学习资源、群内答疑,与同学们一起交流进步

了解社群详情