扣子知识库介绍
扣子的知识库功能支持上传外部数据(例如本地文件、实时在线数据),通过向量搜索来检索最相关的内容以回答用户的问题,这可以帮助你的 Bot 更精确地回答问题。
功能概述
扣子提供了简单易用的方式来存储和管理外部数据,让你的 Bot 可以与指定的数据进行交互。将数据上传到扣子知识库后,扣子会自动将你的文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。例如:
- 你可以将几十页的产品介绍文档导入知识库,当 Bot 使用了这个知识库后,你就可以拥有一个专属产品顾问 Bot。
- 你可以将常关注的资讯网站或在线论文导入知识库,通过知识库的自动更新能力,让 Bot 帮助你收集最新数据。
应用场景
扣子支持上传文本内容和结构化的表格数据,可满足不同的使用场景。例如:
- 语料补充:如需创建一个虚拟形象与用户交流,你可以在知识库中保存该形象相关的语料。后续 Bot 会通过向量召回最相关的语料,模仿该虚拟形象的语言风格进行回答。
- 客服场景:将用户高频咨询的产品问题添加到知识库后,Bot 可以通过这些知识精准回答用户问题。
- 垂直场景:创建一个包含各种车型详细参数的汽车知识库。当用户查询某一车型的百公里油耗是多少时,可通过该车型召回对应的记录,然后进一步识别出百公里油耗。
功能特性
扣子知识库功能提供了以下能力。
- 丰富的数据源
扣子支持通过以下方式上传文本内容或结构化的表格数据到知识库中用来响应用户问题。
- 本地文件:你可以将存储在.txt、.pdf、.docx、.csv和.xlsx格式中的本地内容上传到知识库中。
- 在线网站:你可以将指定网站上的线上内容添加到知识库中。
- API:你可以通过 API 方式将 JSON 数据上传至知识库。
- 自定义:你可以手动将自己的数据上传到知识库。
- 灵活的内容分割
知识库分段是一条独立的信息或特定的内容块。上传到知识库中的内容会被自动分割成多段,然后通过向量召回,召回最相关的片段,帮助模型提高回答的准确性。
此外,扣子也支持通过自定义的方式进行内容分割,例如通过分段标识符、字符长度等方式进行内容分割。
使用限制
下表列出了每个用户在所有团队可创建的最大资源限制。
资源 |
限制说明 |
知识库数量 |
单用户最多可创建 1000 个知识库。 |
知识库容量 |
单用户每月最多可新增 2 GB 数据,上限为 10 GB。 |
单元数量 |
单知识库内最多可添加 100 个单元。 |
分段数量 |
单个单元内最多可保存 10000 个分段。 |
表格类型的单元内的字段数量 |
单个表格格式的单元内,最多可添加 10 列字段。 |
相关文档
如需了解知识库的使用说明,参见创建并使用知识库。