支持的端点
本页列出 AISIX 支持的调用方端点,包括 OpenAI 兼容端点、Anthropic Messages 和其他专用能力。
AISIX 会为应用团队已经使用的请求格式暴露代理端点。如果你还不确定在选择服务提供方、模型别名或流量策略前应该调用哪种客户端 API 形态,可以从本页开始。
主要 API 类型
| API 类型 | 路由 | 适用场景 |
|---|---|---|
| Chat Completions | POST /v1/chat/completions | OpenAI 兼容聊天请求、流式聊天、工具调用、路由模型和集成模型。 |
| Anthropic 风格 Messages API | POST /v1/messages, POST /v1/messages/count_tokens | Anthropic 风格 messages 请求,以及 Anthropic 上游模型的 token 计数。 |
| Responses API 代理 | POST /v1/responses | Responses API 客户端,以及跨受支持服务提供方的智能体风格响应链路。 |
| 文本补全 | POST /v1/completions | 兼容旧版 OpenAI 文本补全客户端。 |
| 向量嵌入 | POST /v1/embeddings | 通过受支持服务提供方生成向量嵌入。 |
| 重排序 | POST /v1/rerank | 通过受支持服务提供方执行文档重排序。 |
| 图像生成 | POST /v1/images/generations | 文生图请求。 |
| 语音与音频 | POST /v1/audio/transcriptions, POST /v1/audio/translations, POST /v1/audio/speech | 语音转文本、语音翻译和文本转语音请求。 |
| 服务提供方透传 | ANY /passthrough/:provider/*rest | 需要使用 AISIX 认证和配额检查、但不希望 AISIX 标准化请求体的服务提供方专属调用。 |
发现与健康检查
| 端点 | 适用场景 |
|---|---|
GET /v1/models | 返回该调用方 API Key 可访问的模型别名。适用于客户端需要发现面向网关的模型别名时。 |
GET /livez | 检查代理监听器是否存活。它适用于代理监听器健康检查,不代表模型或服务提供方已就绪。 |
网关行为
模型化代理路由共享同一套核心网关行为:AISIX 会认证调用方 API Key、检查模型访问权限、解析请求中的模型别名、执行已配置的控制项、调度到选中的上游服务提供方,并在路由可归因到模型时记录用量和遥测。
部分行为与路由相关。例如,匹配缓存策略后响应缓存适用于 Chat Completions,集成模型支持 Chat Completions,而 token 计数仅限 Anthropic 上游模型。服务提供方和路由约束请参见服务提 供方兼容性。
准确的请求与响应细节请参见代理 API 参考。