RAGAI学习笔记

RAGFlow 在线体验平台

May 27, 2026

文件列表

切片管理

检索检测

配置详细参数

基础信息

配置	问号说明 / 含义
名称	知识库名称，必填。
语言	文档主语言，影响解析/理解策略。
头像	可上传知识库图片；提示是最多 4MB。
描述	知识库描述。
权限	如果设为“团队”，所有团队成员都可以操作该知识库。
嵌入模型	知识库默认 embedding 模型。已有 chunk 后切换模型会做兼容性校验，新旧向量平均余弦相似度需 >= 0.9，否则要先删除所有 chunk。
页面排名 PageRank	检索时给这个知识库额外加权，匹配 chunk 的混合相似度会叠加 PageRank 分数，从而更靠前。
标签集	选择一个或多个标签知识库，给本知识库 chunk 自动打标签；基于文本相似度，可提升检索准确性。标签集是封闭集合，和自动关键词不同。

解析 / Ingestion Pipeline

配置	问号说明 / 含义
解析方法	选择用“内置”还是“选择 pipeline”。
内置	当前使用 RAGFlow 内置切片方法，说明在右侧。
选择 pipeline	改用自定义 ingestion pipeline，而不是内置切片方法。

General 内置切片配置

配置	问号说明 / 含义
PDF 解析器	用视觉模型分析 PDF 布局，识别标题、文本块、图片、表格位置；选 Naive 只能拿纯文本；只对 PDF 生效。
建议文本块大小	chunk token 阈值。小文本段会继续合并，直到再合并会超过阈值才生成 chunk；如果没遇到分段标识符，即使超过阈值也不会强行生成新 chunk。
文本分段标识符	支持多字符分隔符，多字符用反引号包裹；会先按这些标识符切小段，再按建议 chunk 大小拼装。
子文本块用于检索	开启后会生成更细的子 chunk 用于检索，通常适合希望召回更精细片段的场景。
子文本块分段标识符	和上面的分段标识符机制一致，但用于子 chunk。
PageIndex / 目录抽取	对已有 chunk 生成每个文件的层级目录；查询时可让大模型判断问题相关目录项，再定位相关 chunk。
图像与表格上下文窗口	抓取图像/表格上下方 N 个 token，给该 chunk 补上下文。
自动元数据	自动生成元数据；只影响新解析文件，已有文件需重新解析；会消耗配置里的索引模型 token。
重叠百分比	相邻两个 chunk 之间保留多少重叠内容。
自动关键词提取	为每个 chunk 提取 N 个关键词，提高查询精度；会消耗索引模型 token，可手动编辑结果。
自动问题提取	为每个 chunk 生成 N 个问题以提升排名得分；失败不会阻断切片，只会留下空结果。
表格转 HTML	与 General 搭配。关闭时 Excel 按行解析成键值对；开启时解析为 HTML 表格，超过 12 行会每 12 行拆成多个 HTML 表。

全局索引

配置	问号说明 / 含义
Indexing model / 索引模型	用于生成知识图谱、RAPTOR、自动元数据、自动关键词、自动问题；模型能力会影响生成质量。
提取知识图谱	基于知识库所有 chunk 构建知识图谱，提升多跳/复杂问题回答正确率；很耗 token 和时间。
实体类型	知识图谱抽取时关注的实体类别，比如 organization、person、geo 等。
方法	Light：用 LightRAG 提示词；General：用 Microsoft GraphRAG 提示词；NER：用 spaCy NER 和规则关键词抽取，快且省资源。当前 UI 主要开放 Light / General。
批量 chunk token 大小	发给 LLM 做实体/关系抽取时，每批 chunk 的 token 上限；NER 不适用。
实体归一化	合并同义实体，让图谱更简洁准确，例如把“特朗普总统 / Donald Trump / Donald J. Trump”合并。
社区报告生成	将实体关系聚成层级社区，再用 LLM 生成社区摘要报告。

RAPTOR

配置	问号说明 / 含义
使用召回增强 RAPTOR 策略	适合复杂多跳问答；需要在文件页通过“生成 > RAPTOR”开启。
生成范围	选择 RAPTOR 生成范围：整个知识库或单个文件。
提示词	给 LLM 的任务说明和输出要求，可用变量传入内容。
最大 token 数	每个被总结文本块的最大 token 数。
阈值	chunk 聚类所需的最小语义相似度；越高每组越少，越低每组越多。
聚类方法	GMM 或 AHC；AHC 可支持更大最大聚类数，但大规模输入更占内存。
最大聚类数	最多创建多少个聚类。
随机种子	伪随机算法起点，保证多次运行可复现。

搭建 rag 聊天助手

每个参数都可以自定义设置

参数	当前值/状态	问号提示的意思
系统提示词	文本框	给 LLM 的总指令，比如角色、回答长度、语气、语言、是否只能基于知识库回答等。`{knowledge}` 是系统保留变量，代表检索召回的知识库文本块。
相似度阈值	`0.2`	检索时会计算“混合相似度”。低于这个阈值的文本块会被过滤掉。默认 `0.2`，大致表示混合相似度分数至少 20 才会召回。
向量相似度权重	`vector 0.30 / full-text 0.70`	混合得分由向量语义相似度和全文/关键词相似度组成，两个权重相加为 `1.0`。当前更偏全文关键词匹配，语义向量占 30%。如果启用 Rerank，向量相似度部分会被 rerank 分数替代。
Top N	`8`	不是所有超过相似度阈值的块都会给 LLM，只会把排名最高的 Top N 个文本块放进上下文。
多轮对话优化	关闭	多轮对话时，会根据历史上下文优化当前查询问题。好处是更懂上下文，代价是额外调用大模型、消耗 token。
使用知识图谱	关闭	是否在检索时使用所选知识库里的知识图谱，适合复杂多跳问题。会检索实体、关系、社区报告等文本块，所以检索时间会明显变长。
推理	关闭	是否启用类似 DeepSeek-R1 / OpenAI o1 的推理工作流，让模型分步骤处理复杂问题。适合逻辑、多步问题，但更慢、更耗资源。
Rerank 模型	未选择	可选。为空时用“关键词相似度 + 向量相似度”；选了 rerank 后，用“关键词相似度 + rerank 分数”。能提升排序质量，但会显著增加响应时间。
变量	`knowledge`	配合系统提示词使用的变量。`knowledge` 是保留变量，表示召回的知识库内容；变量需要用 `{}` 写进系统提示词。
模型	`deepseek-chat`	用于最终生成回答的大语言模型。
自由度	平衡	一个快捷档位，控制模型回答保守还是发散；对应温度、Top P、惩罚项等参数组合。
温度	`0.5`	控制随机性。越低越稳定保守，越高越有创造性和多样性。
Top P	`0.85`	核采样参数，只在累计概率达到 P 的候选词集合里采样。越低越收敛，越高越开放。
存在处罚	`0.2`	惩罚已经出现过的内容，鼓励模型引入新信息，减少一直围绕同一点重复。
频率惩罚	`0.3`	惩罚频繁重复的词或短语，降低机械重复。
最大 token 数	关闭/未填	限制单次回答的最大输出长度；值不合理可能导致报错。

创建智能体

京ICP备2025112521号-1