前面四天,我们学会了创建 Bot、使用插件、设计工作流。但你有没有发现一个问题:Bot 只能基于通用知识回答,对于你的专业领域、公司业务、产品细节,它一无所知。这时候就需要知识库(Knowledge Base)——给 Bot 喂入专属资料,让它成为你的领域专家。
一、什么是知识库
1.1 知识库的作用
知识库就像给 Bot 配备了一个"专业资料库"。当用户提问时,Bot 会先在知识库中搜索相关内容,然后基于这些资料生成回答。
对比示例:客服 Bot
❌ 没有知识库
用户:"你们的退货政策是什么?"
Bot:"一般来说,退货政策包括..."(泛泛而谈,不准确)
问题:回答不准确,可能误导用户
✅ 有知识库
用户:"你们的退货政策是什么?"
Bot:"根据我们的退货政策,购买后7天内可无理由退货,需保持商品完好..."(精准引用公司政策)
优势:准确、专业、可信
1.2 知识库的工作原理
上传资料
将文档、网页、FAQ 等资料上传到 Coze
自动分块和向量化
Coze 将文档切分成小段,转换为向量(数字表示)
用户提问
用户向 Bot 提问
语义搜索
Bot 在知识库中搜索与问题最相关的内容(不是关键词匹配,而是语义理解)
生成回答
Bot 基于检索到的内容,结合 LLM 生成准确的回答
💡 关键概念:语义搜索
传统搜索靠关键词匹配,语义搜索靠"理解意思"。
示例:
用户问:"怎么申请退款?"
知识库中没有"申请退款"这个词,但有"退货流程"、"退款政策"
语义搜索能理解这些内容都与用户问题相关,并返回正确答案
二、知识库的类型
Coze 支持多种类型的知识来源,可以根据需求选择。
2.1 文档类型
本地文档
常用上传本地文件,支持多种格式。
支持格式:
• PDF、Word(.docx)、Excel(.xlsx)
• TXT、Markdown(.md)
• PPT(.pptx)
适用场景:
产品手册、操作指南、FAQ文档、培训资料
在线网页
常用输入网页 URL,Coze 自动抓取内容。
支持方式:
• 单个网页 URL
• 批量导入多个 URL
• 自动爬取整个网站(需配置)
适用场景:
官网内容、博客文章、帮助中心、在线文档
结构化数据
高级以表格形式组织的问答对或数据。
格式:
• CSV、Excel 表格
• 问题-答案对(Q&A)
适用场景:
FAQ、产品参数表、价格表、联系方式
API 数据源
高级连接外部数据库或 API,实时获取数据。
支持方式:
• REST API 接口
• 数据库连接(需配置)
适用场景:
实时库存、订单状态、用户信息、动态内容
2.2 如何选择知识库类型
📄 内容固定、更新不频繁 → 本地文档
例如:产品说明书、公司介绍、操作手册
🌐 内容在线、需要定期同步 → 在线网页
例如:官网内容、博客文章、帮助中心
❓ 问答形式、结构清晰 → 结构化数据
例如:FAQ、常见问题、产品参数对比
🔄 数据实时变化 → API 数据源
例如:库存查询、订单状态、用户余额
三、创建和管理知识库
3.1 创建知识库(完整流程)
1️⃣进入知识库管理
• 在 Coze 工作台,点击左侧菜单"知识库"
• 点击"创建知识库"按钮
2️⃣基础配置
知识库名称
起一个清晰的名字,如"产品FAQ"、"操作手册"
描述(可选)
说明这个知识库包含什么内容,方便后续管理
分块策略
选择如何切分文档:
- • 自动分块(推荐):Coze 自动按段落切分
- • 固定长度:每 N 个字符切一块
- • 按标题:按文档标题层级切分
3️⃣上传内容
方式一:上传文件
点击"上传文件",选择本地文档
支持批量上传,单个文件最大 10MB
方式二:输入网页 URL
粘贴网页链接,Coze 自动抓取内容
可以批量导入多个 URL
方式三:手动输入
直接在编辑器中输入文本内容
适合少量内容或临时添加
4️⃣处理和索引
• 上传后,Coze 会自动处理文档(分块、向量化)
• 处理时间取决于文档大小,通常几秒到几分钟
• 处理完成后,状态显示为"已索引"
5️⃣关联到 Bot
• 进入 Bot 编辑页面
• 在"知识库"选项卡,点击"添加知识库"
• 选择刚创建的知识库,保存
💡 一个 Bot 可以关联多个知识库
3.2 知识库管理
更新内容
- • 添加新文档:随时上传新文件或 URL
- • 删除文档:选中文档,点击删除
- • 重新索引:修改文档后,点击"重新索引"更新
测试知识库
在知识库页面,有"测试"功能,可以输入问题,查看检索结果。
测试内容:
• 输入问题,查看返回了哪些相关片段
• 检查相关性评分(0-1,越高越相关)
• 调整检索参数,优化结果
版本管理
Coze 会保存知识库的历史版本,可以回滚到之前的状态。
四、知识库配置与优化
4.1 检索参数配置
在 Bot 的知识库设置中,可以调整检索参数,影响搜索结果的质量和数量。
Top K(返回结果数量)
检索时返回最相关的 K 个片段。
• 默认值:3-5
• 太小:可能遗漏重要信息
• 太大:引入不相关内容,影响回答质量
💡 建议:从 3 开始,根据效果调整
相似度阈值
只返回相似度高于阈值的片段(0-1)。
• 默认值:0.7
• 阈值高:结果更精准,但可能找不到答案
• 阈值低:结果更多,但可能不相关
💡 建议:0.6-0.8 之间
检索模式
选择检索策略。
• 语义检索:基于语义理解(推荐)
• 关键词检索:基于关键词匹配
• 混合检索:结合两种方式
💡 建议:优先使用语义检索
4.2 内容质量优化
💡 提升知识库效果的技巧
内容结构化
使用清晰的标题、段落、列表,避免大段文字堆砌
避免重复内容
相同或相似的内容会干扰检索,删除冗余文档
使用问答格式
对于 FAQ,用"问题:... 答案:..."格式,检索效果更好
定期更新
及时删除过时内容,添加新资料
控制文档大小
单个文档不要太大(建议小于 5MB),太大会影响处理速度
4.3 提示词优化
在 Bot 的提示词中,明确说明如何使用知识库,可以提升回答质量。
推荐提示词模板:
你是一个专业的客服助手。 ## 知识库使用规则 1. 优先使用知识库中的信息回答问题 2. 如果知识库中有相关内容,直接引用,不要自己编造 3. 如果知识库中没有相关信息,明确告知用户:"抱歉,我的知识库中暂时没有这方面的信息" 4. 回答时保持专业、准确、友好 ## 回答格式 - 简洁明了,避免冗长 - 如果是步骤类问题,用列表展示 - 必要时提供相关链接或联系方式
4.4 知识库高级技巧
技巧1:多知识库组合使用
一个 Bot 可以关联多个知识库,按优先级检索。
应用场景:
• 知识库1:最新产品信息(优先级高)
• 知识库2:历史产品资料(优先级中)
• 知识库3:通用FAQ(优先级低)
💡 Bot 会先在优先级高的知识库中搜索,找不到再搜索下一个
技巧2:知识库分片策略
对于大型文档,合理的分片策略能提升检索效果。
按章节分片(推荐)
适合结构化文档,每个章节独立成片
固定长度分片
适合无明显结构的长文本,每 500-1000 字一片
语义分片(智能)
AI 自动识别语义边界,保持内容完整性
技巧3:元数据标注
给文档添加元数据(标签、分类、时间),方便过滤和管理。
示例:
• 标签:产品A、售后、2024年
• 分类:技术文档、用户手册、FAQ
• 优先级:高、中、低
💡 检索时可以按元数据过滤,提高精准度
技巧4:知识库版本控制
为不同版本的产品维护独立的知识库。
• 产品 v1.0 知识库
• 产品 v2.0 知识库
• 产品 v3.0 知识库(当前版本)
💡 用户提问时,Bot 可以根据版本号选择对应知识库
技巧5:知识库与工作流结合
在工作流中灵活使用知识库,实现更复杂的逻辑。
示例流程:
1. 用户提问 → 检索知识库
2. 如果找到答案 → 直接返回
3. 如果没找到 → 调用搜索插件
4. 搜索结果 + LLM 生成答案
5. 将新答案添加到知识库(自动学习)
五、实战案例
5.1 案例一:产品客服 Bot
场景
为电商平台创建客服 Bot,回答产品相关问题。
知识库准备
1. 产品信息库
- • 上传产品说明书(PDF)
- • 导入产品参数表(Excel)
- • 添加产品详情页 URL
2. FAQ 库
- • 整理常见问题和答案(CSV)
- • 包含:退换货、物流、支付等
3. 政策文档
- • 上传退货政策、隐私政策(Word)
配置要点
• Top K: 5(返回5个相关片段)
• 相似度阈值: 0.7
• 检索模式: 语义检索
效果
这款手机支持5G吗?
是的,这款手机支持5G网络。根据产品参数,它支持 SA/NSA 双模5G,覆盖 n1/n3/n41/n78/n79 等主流频段。
更多对话示例
示例2:退货咨询
买了不喜欢可以退吗?
可以的。根据我们的退货政策,购买后7天内可无理由退货,需要满足以下条件:
1. 商品保持完好,包装完整
2. 配件齐全
3. 未激活使用
退货运费由买家承担,退款将在收到商品后3-5个工作日内原路退回。
示例3:物流查询
一般多久能发货?
根据我们的发货政策:
• 现货商品:付款后24小时内发货
• 预售商品:按预售页面标注的时间发货
• 定制商品:7-15个工作日发货
发货后会通过短信和APP通知您物流单号。
5.2 案例二:企业内部知识助手
场景
为公司员工创建内部知识助手,快速查询公司制度、流程、文档。
知识库准备
1. 制度文档
- • 员工手册、考勤制度、报销流程
2. 技术文档
- • 开发规范、API 文档、部署指南
3. 项目资料
- • 项目文档、会议纪要、需求文档
特色功能
- • 支持多知识库:按部门或主题分类
- • 权限控制:不同员工访问不同知识库
- • 定期同步:自动从企业网盘同步最新文档
5.3 案例三:学习辅导 Bot
场景
为在线课程创建学习助手,回答课程相关问题。
知识库准备
1. 课程资料
- • 课程讲义(PDF)
- • 课程视频字幕(TXT)
2. 练习题库
- • 习题和答案(Excel)
3. 参考资料
- • 相关书籍章节、在线文档
使用效果
- • 学生可以随时提问,获得即时解答
- • 减轻老师答疑压力
- • 24小时在线,不受时间限制
六、知识库效果评估
上线知识库后,需要定期评估效果,持续优化。
6.1 评估指标
1. 检索准确率
Bot 检索到的内容是否与用户问题相关。
评估方法:
• 随机抽取 50-100 个对话
• 人工判断检索结果是否相关
• 计算准确率 = 相关结果数 / 总结果数
目标:准确率 > 80%
2. 回答完整度
Bot 的回答是否完整解决了用户问题。
评估方法:
• 查看用户是否追问
• 统计一次性解决率
• 收集用户反馈(满意/不满意)
目标:一次性解决率 > 70%
3. 知识覆盖率
知识库能覆盖多少用户问题。
评估方法:
• 统计"知识库中没有相关信息"的回复次数
• 分析高频未覆盖问题
• 计算覆盖率 = 有答案的问题数 / 总问题数
目标:覆盖率 > 85%
4. 响应速度
Bot 检索知识库并生成回答的时间。
评估方法:
• 记录每次对话的响应时间
• 计算平均响应时间
• 分析慢查询原因
目标:平均响应时间 < 3秒
6.2 优化方向
根据评估结果优化
准确率低 → 优化内容质量
- • 删除不相关或过时的文档
- • 改进文档结构,使用清晰的标题和段落
- • 调整分块策略
完整度低 → 补充内容
- • 分析用户追问的内容,补充到知识库
- • 增加更详细的说明和示例
- • 优化提示词,引导 Bot 给出更完整的回答
覆盖率低 → 扩充知识库
- • 收集高频未覆盖问题
- • 编写对应的文档或FAQ
- • 添加到知识库
响应慢 → 性能优化
- • 减小文档大小
- • 降低 Top K 值
- • 使用更快的检索模式
6.3 持续改进流程
每周数据回顾
查看本周的对话记录,统计关键指标
识别问题
找出回答不准确、不完整、未覆盖的问题
更新知识库
补充缺失内容,修正错误信息,删除过时文档
测试验证
用之前的问题重新测试,确认改进效果
记录改进
记录本次改进的内容和效果,形成知识积累
七、常见问题
Q1: Bot 没有使用知识库内容怎么办?
可能的原因:
- • 知识库没有关联到 Bot
- • 知识库中没有相关内容
- • 相似度阈值设置太高
- • 提示词中没有引导使用知识库
解决方案:
- • 检查知识库是否已关联
- • 用测试功能验证知识库内容
- • 降低相似度阈值(如 0.6)
- • 在提示词中明确要求使用知识库
Q2: Bot 回答不准确,引用错误内容?
可能的原因:
- • 知识库中有重复或矛盾的内容
- • Top K 设置太大,引入不相关内容
- • 文档分块不合理
解决方案:
- • 清理知识库,删除重复内容
- • 减小 Top K(如从 5 降到 3)
- • 调整分块策略,重新索引
Q3: 知识库可以存储多少内容?
Coze 对知识库容量有限制,具体取决于你的套餐:
- • 免费版:通常 10-50MB
- • 付费版:100MB - 1GB+
建议:定期清理不常用的文档,保持知识库精简。
Q4: 知识库更新后,Bot 多久生效?
添加或删除文档后,需要重新索引,通常几秒到几分钟。索引完成后立即生效。
💡 提示:可以在知识库页面查看索引状态。
八、最佳实践
1. 知识库分类管理
不要把所有内容放在一个知识库,按主题或用途分类:
- • 产品知识库:产品信息、参数、使用说明
- • 服务知识库:FAQ、政策、流程
- • 技术知识库:API 文档、开发指南
2. 定期维护
- • 每月检查一次,删除过时内容
- • 及时添加新资料
- • 根据用户反馈优化内容
3. 监控效果
定期查看 Bot 的对话记录,分析:
- • 哪些问题 Bot 回答得好
- • 哪些问题 Bot 答不上来(补充知识库)
- • 哪些内容被频繁检索(优化排序)
4. 结合工作流
知识库 + 工作流 = 更强大的 Bot。例如:先检索知识库,如果没找到答案,再调用搜索插件。
总结
今天我们学习了 Coze 的知识库功能。知识库让 Bot 从"通用助手"升级为"领域专家",能够基于你的专属资料提供准确、专业的回答。
关键要点:
- • 知识库通过语义搜索,理解用户问题并返回相关内容
- • 支持多种类型:本地文档、在线网页、结构化数据、API 数据源
- • 创建流程:上传内容 → 自动索引 → 关联到 Bot
- • 优化技巧:内容结构化、避免重复、定期更新、调整检索参数
- • 实战应用:客服 Bot、企业知识助手、学习辅导 Bot
下一章预告
Day 6 我们将学习多轮对话功能。如何让 Bot 记住上下文,实现连贯的对话体验,打造真正智能的对话系统。