跳到主要内容

资源模型

AISIX AI 网关通过一组精简资源,将调用方请求转换为已完成上游认证的服务提供方请求。

核心资源包括调用方 API Key、模型和服务提供方密钥。当你需要故障转移、负载分配、限流、安全护栏、缓存、可观测性或托管预算检查时,可以在这条链路上继续叠加多目标模型和策略资源。

资源关系

对于单目标模型,核心资源之间的关系如下:

调用方 API Key 用于认证客户端并控制模型访问权限。模型资源定义客户端发送的模型别名,引用 AISIX 调用上游时使用的服务提供方密钥,并保存上游模型 ID。服务提供方密钥则保存上游凭证、base URL、服务提供方标签和适配器设置。

自托管快速上手中,调用方 API Key 是 sk-demo-caller,模型别名是 gpt-4o-mini,服务提供方密钥保存 OpenAI 凭证,上游模型同样是 gpt-4o-mini

在生产环境中,别名和上游模型不必相同。例如,应用可以持续发送 prod-chat,而网关在该别名背后切换上游模型、服务提供方密钥或路由策略。

核心流量资源

大多数 AISIX 流量都从三个资源开始:调用方 API Key、模型和服务提供方密钥。它们共同决定谁可以调用网关、调用方可以使用哪个模型别名,以及 AISIX 会调用哪个上游服务提供方。

调用方 API Key

调用方 API Key 是应用调用 AISIX 时使用的网关凭证。

该密钥用于认证调用方,并控制调用方可以使用哪些模型别名。关于密钥哈希、轮换和允许列表,请参见调用方 API Key

模型

模型是调用方在请求体中发送的、面向网关的模型别名。

对于单目标模型,面向调用方的别名可以不同于上游服务提供方的模型 ID。模型还会指向 AISIX 调用上游时应使用的服务提供方密钥。单目标和多目标模型配置请参见模型别名

服务提供方密钥

服务提供方密钥保存 AISIX 解析模型后用于访问上游的凭证和连接设置。

服务提供方密钥可以让上游凭证不进入应用代码,并允许多个模型复用同一个上游账号、base URL 和适配器族。关于凭证字段、base URL 行为、服务提供方标签和适配器,请参见服务提供方凭证

多目标模型

多目标模型是由 routing 配置支撑的模型别名。它指向目标模型别名,而不是自己携带服务提供方密钥和上游模型。

调用方仍然只发送一个稳定的模型别名。AISIX 会在请求时将该别名解析到某个目标模型,因此你可以在不修改应用代码的情况下调整上游选择。

配置细节请参见路由与故障转移

策略资源

策略资源会围绕调用方 API Key、模型和服务提供方密钥组成的链路添加网关行为。

限流用于控制请求速率和并发。安全护栏用于检查请求或响应内容。缓存可以复用 Chat Completions 响应。可观测性导出器会把网关追踪数据发送到兼容 OTLP/HTTP 的后端。

预算检查通过 AISIX Cloud 托管策略执行。自托管网关不会暴露本地预算资源。