路由与故障转移
本指南将介绍如何创建多目标模型,用一个面向调用方的模型别名承载多个目标模型。
多目标模型不会直接调用服务提供方。它使用 routing 配置块指向目标模型别名,并由 AISIX 为每次请求选择其中一个目标。
准备工作
请先准备以下内容:
- 一个 Admin 和代理监听器都可用的自托管网关。
- 网关
config.yaml中的 Admin Key。 - 两个可以承载流量的目标模型。如果还没有创建,请先配置服务提供方凭证和模型别名。
- 一个用于验证的调用方 API Key。可以按照调用方 API Key 创建,也可以在本指南中创建。
选择路由策略
请根据面向调用方的别名需要承担的行为选择策略:
- 使用
failover保留一个主目标,并配置备用目标。 - 使用
round_robin在多个相似目标之间轮转请求。 - 使用
weighted将更多流量发送到部分目标。
AISIX 会在可重试的上游失败上执行重试和故障转移,例如 5xx 响应、请求超时和传输错误。大多数上游 4xx 响应会被视为调用方侧问题,不会触发故障转移;但启用 retry_on_429 时,429 例外。