上游管理用于接入模型供应商或兼容服务。管理员在这里维护上游名称、服务地址、兼容协议、鉴权信息、超时设置、默认参数、远端模型和熔断状态。

使用入口#

进入管理端后打开“上游”。页面显示上游列表,支持搜索名称和地址,并按状态、兼容类型筛选。

上游是平台模型的真实来源。用户在对话中选择的是平台模型,平台模型再通过路由绑定调用一个或多个上游模型。因此,上游配置是否可用会直接影响模型调用稳定性。

上游列表#

列表会展示上游名称、地址、兼容协议、模型数量、超时设置、更新时间和状态。状态包括正常、停用和熔断中。

管理员可以启用或停用上游,也可以批量删除。停用上游后,它不会继续参与路由;已经绑定到平台模型的来源可能因此减少可用通道。

新增和编辑上游#

新增上游时,需要填写名称、服务地址、兼容类型和请求协议。根据服务商和协议不同,还可以配置鉴权密钥、默认 Header、默认参数、超时、重试、模型类别和能力范围。

编辑上游时,密钥类字段通常不会完整回显。留空通常表示沿用原值;如果要替换密钥,应填写新值并保存。

建议为不同供应商、不同区域或不同业务用途建立独立上游,名称中体现用途,例如“OpenRouter 生产”“内部 Gemini”“图像生成备用”。

远端模型同步#

上游支持同步远端模型。同步后,管理员可以将远端模型加入平台模型来源,或在管理模型时使用这些真实模型进行路由绑定。

远端模型同步适合供应商经常新增模型、或需要批量接入模型目录的场景。同步前应确认上游地址、密钥和协议配置可用;同步后再检查模型类别和能力是否符合预期。

路由绑定#

上游管理中可以查看和管理当前上游下的路由绑定。绑定关系决定某个真实模型是否作为某个平台模型的来源之一。

当上游维护、停用或删除时,应先查看绑定关系,确认是否会影响关键平台模型。需要替换供应商时,建议先新增新上游和新绑定,通过模型测试确认可用,再停用旧上游。

熔断管理#

当上游出现连续失败或稳定性问题时,系统可能进入熔断状态。熔断中的上游会在预计恢复时间前减少或停止参与调用。

管理员可以手动立即熔断,也可以结束熔断。手动熔断适合供应商维护、密钥异常、余额不足或网络不稳定时临时止损;结束熔断前应先确认上游已经恢复。

超时和重试#

超时设置会影响用户等待时间和失败判定。对话模型通常需要较短且稳定的超时;图像、视频、OCR 或长任务相关上游可能需要更长时间。

重试可以缓解偶发失败,但过多重试会增加用户等待和费用风险。建议根据供应商稳定性、模型类型和业务优先级设置,而不是统一拉高。

使用建议#

先创建少量核心上游并完成模型同步,再配置平台模型路由。生产环境建议至少为关键模型准备备用上游。修改密钥、地址、协议或超时后,及时到模型管理中测试受影响平台模型。