diff --git a/docs/img/ai/ai_benchmark_create.jpg b/docs/img/ai/ai_benchmark_create.jpg
new file mode 100644
index 00000000..0fbb5c9c
Binary files /dev/null and b/docs/img/ai/ai_benchmark_create.jpg differ
diff --git a/docs/img/ai/ai_benchmark_detail.jpg b/docs/img/ai/ai_benchmark_detail.jpg
new file mode 100644
index 00000000..66cf1f0f
Binary files /dev/null and b/docs/img/ai/ai_benchmark_detail.jpg differ
diff --git a/docs/img/ai/ai_benchmark_list.jpg b/docs/img/ai/ai_benchmark_list.jpg
new file mode 100644
index 00000000..91f77497
Binary files /dev/null and b/docs/img/ai/ai_benchmark_list.jpg differ
diff --git a/docs/img/ai/ai_gateway_api_keys.jpg b/docs/img/ai/ai_gateway_api_keys.jpg
new file mode 100644
index 00000000..aab61b5a
Binary files /dev/null and b/docs/img/ai/ai_gateway_api_keys.jpg differ
diff --git a/docs/img/ai/ai_gateway_content.jpg b/docs/img/ai/ai_gateway_content.jpg
new file mode 100644
index 00000000..036372ec
Binary files /dev/null and b/docs/img/ai/ai_gateway_content.jpg differ
diff --git a/docs/img/ai/ai_gateway_elasticsearch.jpg b/docs/img/ai/ai_gateway_elasticsearch.jpg
new file mode 100644
index 00000000..2a0543e1
Binary files /dev/null and b/docs/img/ai/ai_gateway_elasticsearch.jpg differ
diff --git a/docs/img/ai/ai_gateway_groups.jpg b/docs/img/ai/ai_gateway_groups.jpg
new file mode 100644
index 00000000..3a81f8ac
Binary files /dev/null and b/docs/img/ai/ai_gateway_groups.jpg differ
diff --git a/docs/img/ai/ai_gateway_model_pool.jpg b/docs/img/ai/ai_gateway_model_pool.jpg
new file mode 100644
index 00000000..3e1120e9
Binary files /dev/null and b/docs/img/ai/ai_gateway_model_pool.jpg differ
diff --git a/docs/img/ai/ai_gateway_overview.jpg b/docs/img/ai/ai_gateway_overview.jpg
new file mode 100644
index 00000000..15b73758
Binary files /dev/null and b/docs/img/ai/ai_gateway_overview.jpg differ
diff --git a/docs/img/ai/ai_gateway_setting.jpg b/docs/img/ai/ai_gateway_setting.jpg
new file mode 100644
index 00000000..db667563
Binary files /dev/null and b/docs/img/ai/ai_gateway_setting.jpg differ
diff --git a/docs/img/ai/ai_gateway_status.jpg b/docs/img/ai/ai_gateway_status.jpg
new file mode 100644
index 00000000..f14fd9cf
Binary files /dev/null and b/docs/img/ai/ai_gateway_status.jpg differ
diff --git a/docs/img/ai/ai_gateway_usage.jpg b/docs/img/ai/ai_gateway_usage.jpg
new file mode 100644
index 00000000..9c2d20f7
Binary files /dev/null and b/docs/img/ai/ai_gateway_usage.jpg differ
diff --git a/docs/user_manual/ai/benchmark.md b/docs/user_manual/ai/benchmark.md
new file mode 100644
index 00000000..d5385a62
--- /dev/null
+++ b/docs/user_manual/ai/benchmark.md
@@ -0,0 +1,95 @@
+## 基准测试
+
+!!! note ""
+    基准测试用于对 OpenAI 兼容的大模型服务进行性能压测，帮助评估模型在指定上下文长度、并发数和请求速率下的吞吐与延迟表现。
+
+    进入 1Panel 面板后，打开 **AI -> 基准测试** 页面即可进行管理。
+
+    该功能属于 **1Panel 企业版**。
+
+![基准测试](../../img/ai/ai_benchmark_list.jpg)
+{: .original}
+
+## 1 前置条件
+
+!!! note ""
+    创建基准测试前，请先确认以下条件：
+
+    - 已准备可访问的 OpenAI 兼容接口，例如 AI 网关、vLLM、Ollama 或其他兼容服务
+    - 已准备可用的 API Key，若目标服务不需要认证可按页面要求留空或填写占位值
+    - 已确认需要测试的模型名称
+    - 已准备本地分词器目录，用于按目标 Token 数生成测试数据
+    - 服务器可以正常拉取或使用页面中配置的 vLLM 镜像
+
+> 如果需要测试 AI 网关，请先在 **AI -> AI 网关** 中创建 API Key，并将外部访问地址作为基准测试的服务地址。
+
+## 2 创建测试任务
+
+!!! note ""
+    点击 **创建**，填写服务地址、接口路径、API Key、模型、分词器目录、输入/输出 Token、请求数量、并发数等参数后，点击 **确认** 即可创建任务。
+
+    创建成功后，系统会启动后台任务执行基准测试，并可通过任务日志查看执行过程。
+
+![创建基准测试](../../img/ai/ai_benchmark_create.jpg)
+{: .original}
+
+!!! info "基础参数"
+    - **服务地址**：目标模型服务地址，例如 `http://127.0.0.1:4000`
+    - **接口路径**：OpenAI 兼容接口路径，默认为 `/v1/chat/completions`
+    - **API Key**：目标服务的访问凭证
+    - **模型**：需要测试的模型名称
+    - **分词器**：服务器本地分词器目录，例如 `/opt/1panel/tokenizers/DeepSeek-V3`
+
+!!! info "压测参数"
+    - **输入 Token**：单次请求的输入 Token 数
+    - **输出 Token**：单次请求的输出 Token 上限
+    - **请求数量**：本次测试发送的请求总数
+    - **并发数**：同时发起的请求数量
+    - **请求速率**：限制每秒请求数；选择不限速时会尽量压满目标服务吞吐
+    - **超时时间**：单个任务允许执行的最长时间
+    - **vLLM 镜像**：执行基准测试时使用的镜像
+    - **忽略 EOS**：开启后会尽量生成到配置的输出 Token 数，便于稳定对比吞吐
+    - **额外请求头**：以 JSON 形式追加请求头，例如 `{"X-Request-Source":"1Panel"}`
+
+## 3 查看测试结果
+
+!!! note ""
+    测试任务完成后，可以在列表中查看模型、上下文长度、输出吞吐、总吞吐、首 Token 延迟、状态和创建时间。
+
+    点击任务名称可打开详情抽屉，查看基础信息、运行配置、结果指标、启动命令和原始结果。
+
+![基准测试详情](../../img/ai/ai_benchmark_detail.jpg)
+{: .original}
+
+!!! info "核心指标"
+    - **上下文长度**：输入 Token 与输出 Token 上限之和
+    - **输出吞吐**：模型每秒生成的输出 Token 数，数值越高代表生成速度越快
+    - **总吞吐**：每秒处理的输入 Token 与输出 Token 总数
+    - **首 Token 延迟（TTFT）**：从请求发出到收到第一个 Token 的时间，数值越低代表响应越快
+    - **请求吞吐**：每秒完成的请求数量
+    - **TPOT**：每个输出 Token 的平均生成耗时
+    - **ITL**：输出 Token 之间的平均间隔
+    - **成功请求 / 失败请求**：本次测试中成功和失败的请求数量
+
+> 不同测试任务的输入/输出 Token、并发数、请求速率、网络环境和后端模型不同，指标不应直接混用比较。建议固定测试参数后再对比不同模型或不同部署方式。
+
+## 4 任务操作
+
+!!! note ""
+    在任务列表中，可以对测试任务进行日志查看、重新测试、取消和删除等操作。
+
+    - **日志**：查看任务执行日志，适合排查镜像拉取、连接失败或参数错误
+    - **重新测试**：使用已有任务参数重新创建测试任务
+    - **取消**：任务运行中或等待中时，可以取消执行
+    - **删除**：删除不再需要的测试记录
+
+## 5 常见建议
+
+!!! note ""
+    为了获得更稳定的测试结果，建议：
+
+    - 在服务器负载较低时执行测试
+    - 使用相同的输入/输出 Token、并发数和请求速率进行横向对比
+    - 对同一模型执行多轮测试，关注平均表现而不是单次结果
+    - 如果测试 AI 网关，结合 AI 网关的用量统计和调用日志一起分析
+    - 如果测试本地 GPU 推理服务，结合 GPU 监控观察显存、利用率和温度变化
diff --git a/docs/user_manual/ai/gateway.md b/docs/user_manual/ai/gateway.md
new file mode 100644
index 00000000..4c80952a
--- /dev/null
+++ b/docs/user_manual/ai/gateway.md
@@ -0,0 +1,155 @@
+## AI 网关
+
+!!! note ""
+    AI 网关用于统一接入和管理大模型调用入口。用户可以将已有模型账号导入模型池，通过统一的 OpenAI 兼容接口对外提供服务，并按 API Key、用户组、模型映射、负载策略和内容合规规则控制调用行为。
+
+    进入 1Panel 面板后，打开 **AI -> AI 网关** 页面即可进行管理。
+
+    该功能属于 **1Panel 企业版**。
+
+![AI 网关](../../img/ai/ai_gateway_overview.jpg)
+{: .original}
+
+## 1 网关状态与基础操作
+
+!!! note ""
+    页面顶部展示 AI 网关服务状态，并提供状态查看、启动、停止、重启、设置和日志入口。
+
+    - **状态**：查看网关服务状态、监听端口、负载策略、并发限制、日志路径等运行信息
+    - **启动 / 停止 / 重启**：控制 AI 网关服务运行状态
+    - **设置**：配置监听端口、外部访问地址、负载策略、性能参数和日志保留策略
+    - **日志**：查看 AI 网关服务日志，便于排查启动或调用异常
+
+![AI 网关状态](../../img/ai/ai_gateway_status.jpg)
+{: .original}
+
+## 2 模型池
+
+!!! note ""
+    在 **模型池** 页面，点击 **导入模型账号**，选择已在 1Panel 中维护的模型账号，并配置权重、优先级和模型映射。
+
+    模型映射用于定义客户端请求模型与上游模型之间的对应关系。例如客户端请求 `qwen3-coder`，网关可以将请求转发到上游账号中的实际模型名称。
+
+![AI 网关模型池](../../img/ai/ai_gateway_model_pool.jpg)
+{: .original}
+
+!!! info "参数说明"
+    - **模型账号**：选择已有模型账号，导入后作为 AI 网关后端
+    - **权重**：在加权轮询策略下，权重越高承担的请求越多
+    - **优先级**：在故障转移策略下，优先级越高的模型账号会优先被使用
+    - **模型映射**：左侧为客户端请求模型，右侧为真实上游模型
+    - **启用**：控制该模型账号是否参与网关转发
+
+## 3 用户组
+
+!!! note ""
+    在 **用户组** 页面，可以创建不同调用分组，并为每个用户组设置 QPS 限制。API Key 需要绑定到某个用户组，调用时将继承该用户组的限流规则。
+
+![AI 网关用户组](../../img/ai/ai_gateway_groups.jpg)
+{: .original}
+
+!!! info "参数说明"
+    - **用户组**：用于对 API Key 进行分组管理
+    - **QPS 限制**：限制该用户组每秒可发起的请求数量，`0` 表示不限制
+    - **状态**：禁用用户组后，该组下的 API Key 将无法继续调用网关
+
+## 4 API Key
+
+!!! note ""
+    在 **API Key** 页面，点击 **创建**，选择用户和用户组后保存。创建完成后，客户端即可使用该 API Key 调用 AI 网关。
+
+    页面上方会展示外部访问地址，客户端调用时需要将该地址作为 OpenAI 兼容接口的 Base URL。
+
+![AI 网关 API Key](../../img/ai/ai_gateway_api_keys.jpg)
+{: .original}
+
+!!! info "调用示例"
+    ```bash
+    curl http://<服务器 IP>:4000/v1/chat/completions \
+      -H "Authorization: Bearer <API Key>" \
+      -H "Content-Type: application/json" \
+      -d '{
+        "model": "qwen3-coder",
+        "messages": [
+          {
+            "role": "user",
+            "content": "Hello"
+          }
+        ],
+        "stream": true
+      }'
+    ```
+
+> `model` 参数应填写模型映射中的请求模型名称，不一定等同于上游模型的真实名称。
+
+## 5 用量统计
+
+!!! note ""
+    在 **用量统计** 页面，可以查看请求数、Token 用量、活跃用户、活跃模型、失败请求等统计指标。
+
+    页面还提供按用户、模型供应商、模型名称和关键字的筛选能力，并支持查看调用日志、请求体和调用链路，便于分析成本、排查失败请求和追踪故障转移过程。
+
+![AI 网关用量统计](../../img/ai/ai_gateway_usage.jpg)
+{: .original}
+
+## 6 内容合规
+
+!!! note ""
+    在 **内容合规** 页面，可以维护敏感词、敏感词分组、审计日志和开关设置。
+
+    启用内容合规后，AI 网关会在请求链路中根据敏感词规则进行审计或阻断，帮助降低不合规内容调用风险。
+
+![AI 网关内容合规](../../img/ai/ai_gateway_content.jpg)
+{: .original}
+
+!!! info "处理动作"
+    - **阻断**：命中规则后直接拒绝请求
+    - **仅记录**：命中规则后记录审计日志，但不阻断请求
+
+## 7 网关设置
+
+!!! note ""
+    点击页面顶部的 **设置**，可以调整 AI 网关的基础参数、性能参数和日志策略。
+
+![AI 网关设置](../../img/ai/ai_gateway_setting.jpg)
+{: .original}
+
+!!! info "基础设置"
+    - **监听端口**：AI 网关对外提供服务的端口
+    - **外部访问地址**：客户端使用的 Base URL，通常格式为 `http://<服务器 IP>:<端口>/v1`
+    - **负载策略**：支持轮询、加权轮询和故障转移
+    - **启用**：控制网关转发能力是否开启
+
+!!! info "性能设置"
+    - **最大并发**：限制同时处理的请求数量
+    - **等待队列大小**：超过并发限制后允许进入队列等待的请求数量
+    - **队列等待超时**：请求在队列中的最长等待时间
+    - **非流式请求超时**：普通请求的最长响应时间
+    - **流式空闲超时**：流式请求无数据返回时的最长等待时间
+    - **最大请求体**：限制单次请求体大小
+    - **Runtime 刷新间隔**：网关运行时配置刷新间隔
+
+!!! info "日志设置"
+    - **用量统计保留天数**：控制用量统计数据保留周期
+    - **内容合规审计日志保留天数**：控制内容合规审计数据保留周期
+    - **日志清理间隔**：控制后台清理任务执行间隔
+
+## 8 Elasticsearch 设置
+
+!!! note ""
+    在 **设置 -> Elasticsearch** 标签页中，可以开启请求体日志，将 AI 网关收到的请求体写入 Elasticsearch，便于后续审计、问题定位和调用内容回溯。
+
+![AI 网关 Elasticsearch 设置](../../img/ai/ai_gateway_elasticsearch.jpg)
+{: .original}
+
+!!! info "参数说明"
+    - **启用**：开启后，AI 网关会将请求体日志写入 Elasticsearch
+    - **Elasticsearch 地址**：填写 Elasticsearch 服务地址，例如 `http://127.0.0.1:9200`
+    - **Elasticsearch 认证方式**：支持 `Basic Auth` 和 `API Key`
+    - **Elasticsearch 用户名 / 密码**：选择 `Basic Auth` 时填写
+    - **Elasticsearch API Key**：选择 `API Key` 时填写
+    - **索引前缀**：请求体日志写入的索引前缀，默认可使用 `ai-gateway-requests`
+    - **请求体日志保留天数**：控制请求体日志的保留周期
+    - **单请求体最大保存大小**：限制单次请求体写入 Elasticsearch 的最大体积，超过限制时会进行截断
+
+> 开启请求体日志后，日志中可能包含用户输入内容、提示词或业务上下文，请根据实际合规要求配置 Elasticsearch 的访问控制、保留周期和网络访问范围。
diff --git a/mkdocs.yml b/mkdocs.yml
index 9a1a8bfa..323f6099 100644
--- a/mkdocs.yml
+++ b/mkdocs.yml
@@ -61,6 +61,8 @@ nav:
       - 模型: 
         - Ollama: user_manual/ai/model.md
         - vLLM: user_manual/ai/vllm.md
+      - AI 网关: user_manual/ai/gateway.md
+      - 基准测试: user_manual/ai/benchmark.md
       - MCP: user_manual/ai/mcp.md
       - GPU 监控: user_manual/ai/gpu.md
     - 网站: