GLM 全模态知识库:知识处理及检索
Documentation Index
Fetch the complete documentation index at: https://docs.bigmodel.cn/llms.txt Use this file to discover all available pages before exploring further.
知识处理及检索
支持文本 / 图片 / 音频 / 视频的跨模态智能检索与问答平台
1. 产品概述
GLM 全模态知识库是一款面向企业和团队的智能知识管理平台,支持将文本、图片、音频、视频等多种格式的文件统一存储到知识库中,并通过自然语言提问即可快速跨模态检索相关内容。
| 类型 | 说明 |
|---|---|
| 📄 文本检索 | 支持 PDF / Word / TXT / CSV 等文档全文语义检索 |
| 🖼️ 图片检索 | 上传图片作为查询条件,匹配知识库中的相似内容 |
| 🎵 音频检索 | 对音频片段建立索引,返回相关时间段内容 |
| 🎬 视频检索 | 对视频内容建立索引,精准定位相关片段并可播放 |
2. 快速上手
按照以下 4 步即可完成从创建到检索的完整流程:
3. 知识库管理
3.1 创建知识库
在知识库首页点击「+ 创建知识库」,在弹出面板中完成以下配置:
| 参数 | 描述 |
| ------------------------------------ | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| 知识库版本 | **1. 全模态版**<br />**- 当选择的向量模型为全模态向量模型**<br />- 使用场景:<br /> - 音视频等各模态数据<br /> - 复杂问题查询<br /> - 文档包含复杂图文信息<br /> - 支持语义补全或指代增强等高精度要求的业务场景<br /><br />**2. 文本版**<br />**- 当选择的向量模型为文本向量模型,且导入知识非问答对格式**<br />- 使用场景:单一文本模态信息查询<br /><br />**3. QA版**<br />**- 导入的知识为问答对格式**<br />- 系统将根据文档格式自动将该知识库识别为QA版<br />- 使用场景:<br /> - 精准匹配问题与答案<br /> - 适合结构化的知识体系 |
| 图标 | 为知识库选择一个独特的图标,便于在列表中快速识别和管理。 |
| 知识库名称 | 为您的知识库起一个清晰、唯一的名字。支持中英文、数字及常用符号。 |
| 知识库描述 | 填写知识范围、用途等信息,建议仔细填写该栏以便于模型调用。 |
| 向量化模型 | 「全模态版」支持图片/音视频解析;「文本版」仅处理文档。选择合适的模型来理解您的数据。不同模型在性能、多语言能力和成本上有所差异。 |
| 知识库分类 | 将知识库归入指定分类,方便进行结构化、多层级的管理。 |
| 增强设置<br />(⚠️ 仅对文档类文件生效,不支持处理音图视频文件) | **1. 上下文增强**<br />启用后,系统将保留文档中的关键语义与指代信息,提升复杂问答和精确信息检索的效果。<br />在高准确度场景下,平均召回率提升约20%,适用于复杂问答、精确信息检索等场景启用后会增加glm-4.5的Tokens消耗和时间,请确认资源充足。<br />此操作**不可逆**,启用后无法回退。<br /><br />**2. 深度解析**<br />适合复杂版面分析、表格、公式,按页计费 0.12 元/页<br />启用后,该知识库内所有文档将调用前沿专业版文件解析服务,提升解析精度<br />该操作可逆,对于已解析的文件,关闭后再次开启,不会重复解析及扣费。<br /><br />**3. 图片理解**<br />调用多模态大模型为图片生成文字描述,消耗 glm-4.5v tokens<br />该操作可逆。 |
* **Embedding-3-pro (文本推荐):** 性能最强,支持多语言,性价比高。(0.5元/百万Tokens)
* **Embedding-Multimodel(全模态旗舰):** 模态覆盖全,支持多语言。(0.5元/百万Tokens)
* **Embedding-3:** 性能均衡,适用于多数场景。(0.5元/百万Tokens)
* **Embedding-2:** 基础模型。(0.5元/百万Tokens)
3.2 知识库列表

知识库首页列表
知识库首页以卡片形式展示所有知识库,每张卡片包含以下信息:
- 知识库名称与类型标签(QA版 / 文本版 / 全模态版)
- 知识库 ID(支持一键复制)
- 更新时间 / 文档数量 / 切片数量
- 快捷操作入口:知识检索、知识问答
3.3 导入知识

进入知识库后,点击「+ 导入知识」,支持四种导入方式:
| 方式 | 说明 | 限制 / 备注 |
|---|---|---|
| 本地文档 | 从本机上传文件,上传后可查看进度与处理状态 - 支持文档格式:pdf、docx、doc、pptx、ppt、txt、md、xlsx、xls、csv,单文件不超过 100MB - 支持图片格式:jpeg, png, webp,单张不超过 5 MB - 支持视频格式:mp4, avi, mov,单条时长不超过 15 分钟 - 支持音频格式:pcm, wav, mp3, ogg,单条时长不超过 30 分钟 | 单文档文件 ≤ 100MB 单张图片 ≤ 5MB 音视频 ≤ 15分钟 |
| URL | 填写网络地址直接抓取网页内容,不支持通过该方式上传或导入文件资源 | — |
| 飞书文档 | 连接飞书账号后导入在线文档 | 需先完成飞书账号授权 |
| 问答对 | 直接上传 Q&A 对,适合构建问答型知识库 | — |
3.4 知识状态

文档列表页
文件上传后,在文档列表页可查看每个文件的处理状态:
| 状态 | 说明 |
|---|---|
| 数据处理中 | 文件正在解析和建立向量索引,此阶段暂不可检索 |
| 索引构建中 | 向量索引写入中,即将可用 |
| 处理完成 | 文件已就绪,可以被正常检索 |
| 图片解析中 | 图片文件正在进行多模态理解,生成文字描述(开启图片理解后可见) |
| 数据异常 | 处理失败,可点击刷新图标重试 |
文档列表支持按文件类型筛选(文档文件 / 图片文件 / 视频文件 / 音频文件)及按处理状态过滤。
4. 知识检索
4.1 检索入口

入口一:文档列表页

入口二:知识库卡片页
4.2 检索方式

知识检索主界面
支持三种查询输入方式:
| 方式 | 说明 |
|---|---|
| 文字检索 | 在输入框输入自然语言问题,系统匹配相关文档片段 |
| 图片检索 | 上传图片后以图片内容作为查询条件,跨模态匹配 |
| 组合检索 | 同时输入图片和文字,进行联合跨模态检索 |
4.3 检索参数配置
点击右侧「检索参数设置」面板,可调整以下参数:
| 参数 | 说明 | 默认值 |
|---|---|---|
| 问题改写 | 开启「问题改写」后,系统会在检索前对用户输入的问题进行智能改写,展示在输入框下方的「改写后问题」区域,改写内容包括: - 补充问题背景与语境 - 同义表达扩展,提升召回率 - 点击可展开查看完整改写内容 问题改写功能界面 | 关闭 |
| QA干预 | 优先从 QA 知识库匹配问答对,可设置分数阈值 | 关闭,默认值 0.6 |
| Rerank | 对召回结果重排序,提升结果精准度 | 开启 |
| 召回数量 | 控制最多返回的结果条数 | 8 |
| 召回分数 | 设置最低相似度阈值,低于该值的结果不返回 | 0.3 |
| 文本检索方式 | - 向量检索:纯向量相似度匹配 - 关键词检索:通过关键词匹配 - 混合检索:向量检索 + 关键词检索结合,最优匹配;可调检索配比 | 混合检索,配比 0.8 |
4.4 检索结果说明

检索结果列表
每条检索结果包含以下信息:
- 重排分数 / 重排位次 / 召回分数 / 召回位次
- 文件名称与文件类型图标
- 文档片段内容预览(支持「展开」查看完整内容)
- 音视频结果:显示对应时间段缩略图,支持直接在页面内播放
4.5 音视频内容检索
4.5.1 视频检索

视频检索结果(含时间段预览)
当知识库中包含视频文件时,系统对视频内容建立多模态索引。检索后结果中将显示视频缩略图及精确时间段(如 00:22~00:38),点击可在页面内直接播放对应片段。
4.5.2 音频检索

音频检索结果(含播放控件)
音频文件同样支持语义检索。结果中显示音频文件名、对应时间段与内容摘要,点击后在页面底部展开音频播放控件,可直接收听相关片段。
5. 注意事项
- 文件需等待处理完成才可检索——大文件处理时间较长,请耐心等待状态变为「处理完成」。
- 深度解析按页计费——0.12 元/页,适合格式复杂的 PDF,普通文档无需开启。
- 注意存储空间——免费存储空间为 1GB,用量超过 70% 时建议清理无用文件或升级套餐。
- 知识库计费说明——详见对应文档