代理

模型检查

功能说明

模型检查功能（也称为 Stream Check）用于验证供应商配置的模型是否可用，通过发送实际的 API 请求来测试：

模型是否存在
API Key 是否有效
端点是否正常响应
响应延迟是否正常
流式响应首字节时间（TTFB）

v3.13.0 起，Stream Check 覆盖范围扩展到 Claude / Codex / Gemini / OpenCode / OpenClaw，包括 OpenClaw 的全部协议变体（openai-completions 等）。OpenCode 通过 npm 包映射自动识别；OpenClaw 支持自定义 auth-header 检测，并处理了 Bedrock 错误消息、baseURL 回退等边界情况。

对于使用 Chat Completions 协议的 Codex 第三方供应商（如 DeepSeek、Kimi、MiniMax），Stream Check 会探测 /chat/completions 端点（而非 /responses），并与代理实际转发的 URL 顺序保持一致（origin-only 地址优先尝试 /v1/...），避免把可用供应商误判为不可用。

打开配置

设置 → 高级 → 模型测试

测试模型配置

为每个应用配置用于测试的模型：

应用	配置项	默认值	说明
Claude	Claude 模型	系统默认	建议使用 Haiku 系列（成本低、速度快）
Codex	Codex 模型	系统默认	建议使用 mini 系列
Gemini	Gemini 模型	系统默认	建议使用 Flash 系列
OpenCode	OpenCode 模型	系统默认	v3.13.0 新增，通过 npm 包映射自动检测
OpenClaw	OpenClaw 模型	系统默认	v3.13.0 新增，覆盖全部协议变体及自定义 auth-header

模型选择建议

选择测试模型时考虑：

成本：选择价格较低的模型（如 Haiku、Mini、Flash）
速度：选择响应快的模型
可用性：选择供应商支持的模型

检查参数配置

超时时间

参数	说明	默认值	范围
超时时间	单次请求超时	45 秒	10-120 秒

设置过短可能导致误判，设置过长会延迟故障检测。

重试次数

参数	说明	默认值	范围
最大重试	失败后重试次数	2 次	0-5 次

网络不稳定时建议增加重试次数。

降级阈值

参数	说明	默认值	范围
降级阈值	响应超过此时间标记为降级	6000ms	1000-30000ms

超过阈值的供应商会被标记为「降级」状态，但仍可使用。

执行模型检查

手动测试

在供应商卡片上点击「测试」按钮：

发送测试请求到配置的端点
使用配置的测试模型
等待响应或超时
显示测试结果

测试内容

测试请求会：

发送简短的 prompt（如 "Hi"）
限制最大输出 token（通常 10-50）
使用流式响应检测首字节时间

测试结果

健康状态

状态	图标	说明
健康	🟢	响应正常，延迟在阈值内
降级	🟡	响应正常，但延迟超过阈值
不可用	🔴	请求失败或超时

结果信息

测试完成后显示：

响应延迟（毫秒）
首字节时间（TTFB）
错误信息（如果失败）

与故障转移集成

模型检查与故障转移功能配合使用：

健康检查

开启代理服务后，系统会定期对故障转移队列中的供应商执行健康检查：

使用配置的测试模型发送请求
根据响应更新健康状态
不健康的供应商会被暂时跳过

熔断恢复

当供应商从熔断状态恢复时：

执行模型检查验证可用性
检查通过后恢复正常状态
检查失败则继续熔断

常见问题

测试失败但实际可用

可能原因：

测试模型与实际使用的模型不同
供应商不支持配置的测试模型

解决方法：

修改测试模型为供应商支持的模型
检查供应商的模型列表

延迟过高

可能原因：

网络延迟
供应商服务器负载高
模型响应慢

解决方法：

使用更快的测试模型
调整降级阈值
考虑使用镜像端点

频繁超时

可能原因：

超时时间设置过短
网络不稳定
供应商服务不稳定

解决方法：

增加超时时间
增加重试次数
检查网络连接

注意事项

模型检查会消耗少量 API 配额
建议使用低成本模型进行测试
测试频率不宜过高，避免浪费配额
不同供应商支持的模型可能不同

用量统计

上一页

配置文件说明

下一页