跳到主要内容

支持的端点

本页列出 AISIX 支持的调用方端点,包括 OpenAI 兼容端点、Anthropic Messages 和其他专用能力。

AISIX 会为应用团队已经使用的请求格式暴露代理端点。如果你还不确定在选择服务提供方、模型别名或流量策略前应该调用哪种客户端 API 形态,可以从本页开始。

主要 API 类型

API 类型路由适用场景
Chat CompletionsPOST /v1/chat/completionsOpenAI 兼容聊天请求、流式聊天、工具调用、路由模型和集成模型。
Anthropic 风格 Messages APIPOST /v1/messages, POST /v1/messages/count_tokensAnthropic 风格 messages 请求,以及 Anthropic 上游模型的 token 计数。
Responses API 代理POST /v1/responsesResponses API 客户端,以及跨受支持服务提供方的智能体风格响应链路。
文本补全POST /v1/completions兼容旧版 OpenAI 文本补全客户端。
向量嵌入POST /v1/embeddings通过受支持服务提供方生成向量嵌入。
重排序POST /v1/rerank通过受支持服务提供方执行文档重排序。
图像生成POST /v1/images/generations文生图请求。
语音与音频POST /v1/audio/transcriptions, POST /v1/audio/translations, POST /v1/audio/speech语音转文本、语音翻译和文本转语音请求。
服务提供方透传ANY /passthrough/:provider/*rest需要使用 AISIX 认证和配额检查、但不希望 AISIX 标准化请求体的服务提供方专属调用。

发现与健康检查

端点适用场景
GET /v1/models返回该调用方 API Key 可访问的模型别名。适用于客户端需要发现面向网关的模型别名时。
GET /livez检查代理监听器是否存活。它适用于代理监听器健康检查,不代表模型或服务提供方已就绪。

网关行为

模型化代理路由共享同一套核心网关行为:AISIX 会认证调用方 API Key、检查模型访问权限、解析请求中的模型别名、执行已配置的控制项、调度到选中的上游服务提供方,并在路由可归因到模型时记录用量和遥测。

部分行为与路由相关。例如,匹配缓存策略后响应缓存适用于 Chat Completions,集成模型支持 Chat Completions,而 token 计数仅限 Anthropic 上游模型。服务提供方和路由约束请参见服务提供方兼容性

准确的请求与响应细节请参见代理 API 参考