RAGAI学习笔记

GLM 全模态知识库：知识处理及检索

May 27, 2026

Documentation Index

Fetch the complete documentation index at: https://docs.bigmodel.cn/llms.txt Use this file to discover all available pages before exploring further.

知识处理及检索

支持文本 / 图片 / 音频 / 视频的跨模态智能检索与问答平台

1. 产品概述

GLM 全模态知识库是一款面向企业和团队的智能知识管理平台，支持将文本、图片、音频、视频等多种格式的文件统一存储到知识库中，并通过自然语言提问即可快速跨模态检索相关内容。

类型	说明
📄 文本检索	支持 PDF / Word / TXT / CSV 等文档全文语义检索
🖼️ 图片检索	上传图片作为查询条件，匹配知识库中的相似内容
🎵 音频检索	对音频片段建立索引，返回相关时间段内容
🎬 视频检索	对视频内容建立索引，精准定位相关片段并可播放

2. 快速上手

按照以下 4 步即可完成从创建到检索的完整流程：

进入知识库页面，点击右上角「+ 创建知识库」，填写名称与描述后保存。支持本地上传、URL、飞书文档、问答对等多种方式导入知识内容。系统自动完成解析与索引构建，文件状态变为「数据完成」后即可检索。点击「知识检索」，输入自然语言问题或上传图片，查看匹配结果。

3. 知识库管理

3.1 创建知识库

![Description](https://cdn.bigmodel.cn/markdown/1774938157630image.png?attname=image.png) ![Description](https://cdn.bigmodel.cn/markdown/1774938204914image.png?attname=image.png)

在知识库首页点击「+ 创建知识库」，在弹出面板中完成以下配置：

| 参数                                   | 描述                                                                                                                                                                                                                                                                                                                                                                                     |
| ------------------------------------ | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| 知识库版本                                | **1. 全模态版**<br />**- 当选择的向量模型为全模态向量模型**<br />- 使用场景：<br />    - 音视频等各模态数据<br />    - 复杂问题查询<br />    - 文档包含复杂图文信息<br />    - 支持语义补全或指代增强等高精度要求的业务场景<br /><br />**2. 文本版**<br />**- 当选择的向量模型为文本向量模型，且导入知识非问答对格式**<br />- 使用场景：单一文本模态信息查询<br /><br />**3. QA版**<br />**- 导入的知识为问答对格式**<br />- 系统将根据文档格式自动将该知识库识别为QA版<br />- 使用场景：<br />    - 精准匹配问题与答案<br />    - 适合结构化的知识体系             |
| 图标                                   | 为知识库选择一个独特的图标，便于在列表中快速识别和管理。                                                                                                                                                                                                                                                                                                                                                           |
| 知识库名称                                | 为您的知识库起一个清晰、唯一的名字。支持中英文、数字及常用符号。                                                                                                                                                                                                                                                                                                                                                       |
| 知识库描述                                | 填写知识范围、用途等信息，建议仔细填写该栏以便于模型调用。                                                                                                                                                                                                                                                                                                                                                          |
| 向量化模型                                | 「全模态版」支持图片/音视频解析；「文本版」仅处理文档。选择合适的模型来理解您的数据。不同模型在性能、多语言能力和成本上有所差异。                                                                                                                                                                                                                                                                                                                      |
| 知识库分类                                | 将知识库归入指定分类，方便进行结构化、多层级的管理。                                                                                                                                                                                                                                                                                                                                                             |
| 增强设置<br />（⚠️ 仅对文档类文件生效，不支持处理音图视频文件） | **1. 上下文增强**<br />启用后，系统将保留文档中的关键语义与指代信息，提升复杂问答和精确信息检索的效果。<br />在高准确度场景下，平均召回率提升约20%，适用于复杂问答、精确信息检索等场景启用后会增加glm-4.5的Tokens消耗和时间，请确认资源充足。<br />此操作**不可逆**，启用后无法回退。<br /><br />**2. 深度解析**<br />适合复杂版面分析、表格、公式，按页计费 0.12 元/页<br />启用后，该知识库内所有文档将调用前沿专业版文件解析服务，提升解析精度<br />该操作可逆，对于已解析的文件，关闭后再次开启，不会重复解析及扣费。<br /><br />**3. 图片理解**<br />调用多模态大模型为图片生成文字描述，消耗 glm-4.5v tokens<br />该操作可逆。 |

![Description](https://cdn.bigmodel.cn/markdown/1774938256612image.png?attname=image.png)

* **Embedding-3-pro (文本推荐)：** 性能最强，支持多语言，性价比高。（0.5元/百万Tokens）
* **Embedding-Multimodel（全模态旗舰）：** 模态覆盖全，支持多语言。（0.5元/百万Tokens）
* **Embedding-3：** 性能均衡，适用于多数场景。（0.5元/百万Tokens）
* **Embedding-2：** 基础模型。（0.5元/百万Tokens）

3.2 知识库列表

Description

知识库首页列表

知识库首页以卡片形式展示所有知识库，每张卡片包含以下信息：

知识库名称与类型标签（QA版 / 文本版 / 全模态版）
知识库 ID（支持一键复制）
更新时间 / 文档数量 / 切片数量
快捷操作入口：知识检索、知识问答

3.3 导入知识

Description

进入知识库后，点击「+ 导入知识」，支持四种导入方式：

方式	说明	限制 / 备注
本地文档	从本机上传文件，上传后可查看进度与处理状态 - 支持文档格式：pdf、docx、doc、pptx、ppt、txt、md、xlsx、xls、csv，单文件不超过 100MB - 支持图片格式：jpeg, png, webp，单张不超过 5 MB - 支持视频格式：mp4, avi, mov，单条时长不超过 15 分钟 - 支持音频格式：pcm, wav, mp3, ogg，单条时长不超过 30 分钟	单文档文件 ≤ 100MB 单张图片 ≤ 5MB 音视频 ≤ 15分钟
URL	填写网络地址直接抓取网页内容，不支持通过该方式上传或导入文件资源	—
飞书文档	连接飞书账号后导入在线文档	需先完成飞书账号授权
问答对	直接上传 Q&A 对，适合构建问答型知识库	—

3.4 知识状态

Description

文档列表页

文件上传后，在文档列表页可查看每个文件的处理状态：

状态	说明
数据处理中	文件正在解析和建立向量索引，此阶段暂不可检索
索引构建中	向量索引写入中，即将可用
处理完成	文件已就绪，可以被正常检索
图片解析中	图片文件正在进行多模态理解，生成文字描述（开启图片理解后可见）
数据异常	处理失败，可点击刷新图标重试

仅文档类文件支持调优操作：**切片**（查看解析结果）/ **配置**（调整切片设置）

文档列表支持按文件类型筛选（文档文件 / 图片文件 / 视频文件 / 音频文件）及按处理状态过滤。

4. 知识检索

4.1 检索入口

Description

入口一：文档列表页

Description

入口二：知识库卡片页

4.2 检索方式

Description

知识检索主界面

支持三种查询输入方式：

方式	说明
文字检索	在输入框输入自然语言问题，系统匹配相关文档片段
图片检索	上传图片后以图片内容作为查询条件，跨模态匹配
组合检索	同时输入图片和文字，进行联合跨模态检索

4.3 检索参数配置

点击右侧「检索参数设置」面板，可调整以下参数：

参数	说明	默认值
问题改写	开启「问题改写」后，系统会在检索前对用户输入的问题进行智能改写，展示在输入框下方的「改写后问题」区域，改写内容包括： - 补充问题背景与语境 - 同义表达扩展，提升召回率 - 点击可展开查看完整改写内容改写功能适合口语化提问场景，当用户提问过于简短或模糊时效果显著。问题改写功能界面	关闭
QA干预	优先从 QA 知识库匹配问答对，可设置分数阈值	关闭，默认值 0.6
Rerank	对召回结果重排序，提升结果精准度	开启
召回数量	控制最多返回的结果条数	8
召回分数	设置最低相似度阈值，低于该值的结果不返回	0.3
文本检索方式	- 向量检索：纯向量相似度匹配 - 关键词检索：通过关键词匹配 - 混合检索：向量检索 + 关键词检索结合，最优匹配；可调检索配比	混合检索，配比 0.8

4.4 检索结果说明

Description

检索结果列表

每条检索结果包含以下信息：

重排分数 / 重排位次 / 召回分数 / 召回位次
文件名称与文件类型图标
文档片段内容预览（支持「展开」查看完整内容）
音视频结果：显示对应时间段缩略图，支持直接在页面内播放

4.5 音视频内容检索

4.5.1 视频检索

Description

视频检索结果（含时间段预览）

当知识库中包含视频文件时，系统对视频内容建立多模态索引。检索后结果中将显示视频缩略图及精确时间段（如 00:22~00:38），点击可在页面内直接播放对应片段。

4.5.2 音频检索

Description

音频检索结果（含播放控件）

音频文件同样支持语义检索。结果中显示音频文件名、对应时间段与内容摘要，点击后在页面底部展开音频播放控件，可直接收听相关片段。

5. 注意事项

使用前请注意：

文件需等待处理完成才可检索——大文件处理时间较长，请耐心等待状态变为「处理完成」。
深度解析按页计费——0.12 元/页，适合格式复杂的 PDF，普通文档无需开启。
注意存储空间——免费存储空间为 1GB，用量超过 70% 时建议清理无用文件或升级套餐。
知识库计费说明——详见对应文档

需要密钥才能查看

Documentation Index

知识处理及检索

1. 产品概述

2. 快速上手

3. 知识库管理

3.1 创建知识库

3.2 知识库列表

3.3 导入知识

3.4 知识状态

4. 知识检索

4.1 检索入口

4.2 检索方式

4.3 检索参数配置

4.4 检索结果说明

4.5 音视频内容检索

4.5.1 视频检索

4.5.2 音频检索

5. 注意事项