AISIX 如何融入架构
AISIX AI 网关是面向 AI 流量的专用网关,位于应用和上游模型服务提供方之间。应用团队可以调用稳定的模型别名,平台团队则可以集中管理服务提供方凭证、路由、策略和用量控制。
应用使用调用方 API Key 和模型别名调用 AISIX。AISIX 会将该请求解析到已配置的服务提供方凭证、上游模型和流量策略。
为什么使用 AISIX
AI 流量通常从直接集成服务提供方开始:应用保存服务提供方密钥,选择服务提供方模型 ID,并直接调用该服务提供方的 API。
对于单个应用,这种方式可能已经足够。但当多个应用需要共享凭证、统一策略、服务提供方故障转移、可观测性,或希望在不重新部署应用的情况下切换模型时,直接集成会变得难以运维。
AISIX 会将这些服务提供方侧决策收敛到网关之后:
当 AI 流量需要集中管理凭证、别名、策略和服务提供方路由时,适合使用 AISIX。如果一个应用只直接调用一个服务提供方,也不需要共享密钥、统一策略或服务提供方抽象,直接集成可能已经足够。
运行模 型
请求到达时,AISIX 会认证调用方 API Key,检查该密钥是否可以使用请求中的模型别名,将别名解析为服务提供方侧配置,应用网关策略,并将请求转发到上游。
主要运维模式是职责分离:应用使用稳定的模型别名和调用方 API Key,而服务提供方选择、服务提供方凭证和策略集中保留在网关中。
AISIX 与 AI 插件
Apache APISIX 和 API7 Gateway 可以通过 AI 插件为现有 API 网关路由添加 AI 能力。这条路径适合主要工作负载仍是 API 流量、AI 调用只是更大 API 网关部署中少量路由的团队。
AISIX 面向以 AI 流量为主要网关工作负载的部署场景设计。它把服务提供方密钥、模型别名、调用方 API Key、路由、限流、缓存、安全护栏、可观测性和托管预算检查作为网关资源,而不是路由级插件配置。
当 AI 能力应嵌入现有 API 网关路由时,可以选择 APISIX 或 API7 Gateway 的插件路径。当运维重点是 AI 流量本身,包括集中式服务提供方访问、模型访问、路由、策略、托管预算检查和 AI 请求遥测时,则适合使用 AISIX。