支持的端点

本页列出 AISIX 支持的调用方端点，包括 OpenAI 兼容端点、Anthropic Messages 和其他专用能力。

AISIX 会为应用团队已经使用的请求格式暴露代理端点。如果你还不确定在选择服务提供方、模型别名或流量策略前应该调用哪种客户端 API 形态，可以从本页开始。

主要 API 类型

API 类型	路由	适用场景
Chat Completions	`POST /v1/chat/completions`	OpenAI 兼容聊天请求、流式聊天、工具调用、路由模型和集成模型。
Anthropic 风格 Messages API	`POST /v1/messages`, `POST /v1/messages/count_tokens`	Anthropic 风格 messages 请求，以及 Anthropic 上游模型的 token 计数。
Responses API 代理	`POST /v1/responses`	Responses API 客户端，以及跨受支持服务提供方的智能体风格响应链路。
文本补全	`POST /v1/completions`	兼容旧版 OpenAI 文本补全客户端。
向量嵌入	`POST /v1/embeddings`	通过受支持服务提供方生成向量嵌入。
重排序	`POST /v1/rerank`	通过受支持服务提供方执行文档重排序。
图像生成	`POST /v1/images/generations`	文生图请求。
语音与音频	`POST /v1/audio/transcriptions`, `POST /v1/audio/translations`, `POST /v1/audio/speech`	语音转文本、语音翻译和文本转语音请求。
服务提供方透传	`ANY /passthrough/:provider/*rest`	需要使用 AISIX 认证和配额检查、但不希望 AISIX 标准化请求体的服务提供方专属调用。

端点	适用场景
`GET /v1/models`	返回该调用方 API Key 可访问的模型别名。适用于客户端需要发现面向网关的模型别名时。
`GET /livez`	检查代理监听器是否存活。它适用于代理监听器健康检查，不代表模型或服务提供方已就绪。

模型化代理路由共享同一套核心网关行为：AISIX 会认证调用方 API Key、检查模型访问权限、解析请求中的模型别名、执行已配置的控制项、调度到选中的上游服务提供方，并在路由可归因到模型时记录用量和遥测。

部分行为与路由相关。例如，匹配缓存策略后响应缓存适用于 Chat Completions，集成模型支持 Chat Completions，而 token 计数仅限 Anthropic 上游模型。服务提供方和路由约束请参见服务提供方兼容性。

准确的请求与响应细节请参见代理 API 参考。