(二)知识库检索参数配置
参数名称 | 最佳适用场景 | 参数说明 | 取值范围 | 建议初始值(新手) |
---|---|---|---|---|
检索方式 | 不同数据类型和检索需求场景 | 向量检索:适用于非结构化数据的语义匹配,将数据转换为向量进行检索;全文检索:针对文本内容进行关键字匹配;混合检索:融合向量检索与全文检索技术,综合评估排序 | 向量检索、全文检索、混合检索 | 混合检索 |
Rerank 模型 | 使用混合检索方式时 | 用于对搜索结果进行重新排序的模型,根据用户查询和搜索结果相关性,提供更符合需求的结果 | 平台提供的 Rerank 模型(如 ecnu-rerank 模型等) | ecnu-rerank 模型(若平台无特殊说明) |
召回分段数 | 希望获取不同数量相关信息的场景 | 智能体调用知识库匹配用户输入内容时,返回的数据片段数量,数值越大返回内容越多,但可能增加处理时间和资源消耗 | 正整数 | 10 - 20(可根据知识库内容和问题复杂程度调整) |
相似度设置(仅全文检索时无此配置) | 对检索结果相关性要求不同的场景 | 根据该设置选择知识库内容返回,数值越大,相似度越高,智能体仅召回达到匹配度的数据片段 | 0 - 1(数值越大,匹配越严格) | 0.5 - 0.7(可根据需求微调) |
知识增强 | 希望提高内容完整度的场景 | 开启后,会将匹配到的 topk 上下各 1 个分段内容同时召回,能提高内容完整度,但会增加资源消耗 | 开启 / 关闭 | 关闭(可根据资源情况和需求开启) |
无召回回复 | 知识库无匹配内容时 | 当从知识库中没有召回任何分段时,智能体的响应模式,可选择使用大模型生成回复或指定固定文字回复 | 大模型生成回复、指定固定文字回复(长度 100 字符以内) | 大模型生成回复 |