| 字段 | 配置说明 | 示意图 |
| 分段方式 | 指用于切分段落的分割符号,将在符合"最大段落字符数"要求的符号位置切分段落。 您可以设置标点、中文、英文、数据作为分割符号。 | |
| 最大段落字符数 | 注:内容越短,检索效果越好哦~ 指切分后最大的段落长度,段落长度最大不能超过 512 个字符。 例如:一份 5000 字的文件,"最大段落字符数=500"时,将得到 9~10 段 500 字左右的段落。 | |
| 段落重叠字符数 | 指上下 2 个分段中重复的内容长度。 例如: 右图 1 中,"平台的优势"标题与描述信息分在 2 个段落中,模型检索采用后也没有"平台的优势"相关的内容,这时就可以适当增加"段落重叠字符数",增加 2 段内容的相关性(如图 2)。 |
| 字段 | 配置说明 | 示意图 |
| 表格 | 支持按照表格维度设置表头位置,且支持多选。 | |
| 表头 | 注:没有定义表头位置的表格,将默认第一行为表头! 表头将作为表格的重要语义信息,与表格分段一起检索、输入模型。 仅支持选择表格的前 50 行。 | |
| 检索列 | 检索列可以进一步缩小模型的检索范围,在更有效的数据中检索相关内容。 例如: 右图中将"销售员"列作为"检索列",当用户提问为"张三的业绩是多少"时,就可以只检索销售员列寻找到"张三",即可定位找到业绩收入;如不设置检索列,则需要在整行内容中检索,相关性会大大降低。 |
| 欢迎光临 AI创想 (http://llms-ai.com/) | Powered by Discuz! X3.4 |