更新日志
3.10.1
发布日期:2026-06-15
不兼容变更
插件
-
升级说明
jwt-auth现在默认校验 token 的exp(过期)和nbf(生效时间)声明。此前,未设置claims_to_verify(或将其设为空列表)的 consumer 会接受任何签名正确的 token,包括已过期的 token。数据面升级后,这类 token 会被以HTTP 401拒绝。如果你依赖已过期 token 仍被接受,请在升级前评估此行为变更。如需只校验特定声明,请在 consumer 配置中显式设置
claims_to_verify。 -
Batch Requests
升级说明batch-requests插件现在会限制批量请求的规模。流水线子请求的数量由新增的插件元数据选项max_pipeline_items限制(默认1000),超过上限的批量请求会被以HTTP 400拒绝。包含文档之外字段的流水线条目现在会被拒绝,且每批的timeout至少为1毫秒。如果你发送的批量请求超过 1000 个子请求,请在插件元数据中调大
max_pipeline_items。如果客户端发送了未文档化的条目字段,请在升级前移除它们。
升级须知
当数据面启用数据加密(apisix.data_encryption.enable: true)时,以下插件字段现在会在落盘时加密存储(在原有已加密字段之外新增)。请检查你是否使用了这些插件:
- http-logger:
auth_header - kafka-logger:
brokers.sasl_config.password - splunk-hec-logging:
endpoint.token - loggly:
customer_token - openfunction:
authorization.service_token - azure-functions:
authorization.apikey,以及插件元数据master_apikey - ai-aws-content-moderation:
comprehend.secret_access_key - openid-connect:
session.secret - error-log-logger(插件元数据):
kafka.brokers.sasl_config.password
只有这些凭据的落盘表示(etcd / 备份 / 导出)从明文变为密文,Admin API 返回的值不变。由于控制面一升级就会加密这些字段,请将数据面与控制面一起升级(或在依赖该加密前先升级数据面)——新控制面搭配尚不解密这些字段的旧数据面时,会把密文透传给上游。如果你未启用数据加密,则没有任何变化。
此前仅 limit-count-advanced 独有的全部能力——redis-sentinel 策略、滑动窗口计数、在一份配置中设置多个独立限流(rules)、由 NGINX 变量驱动的动态 count 和 time_window、以及延迟 Redis 同步(sync_interval)——现已内置到 limit-count 插件中。既有的 limit-count-advanced 配置可继续原样使用(该插件作为薄封装保留),无需做配置迁移。
一个升级时的影响:对于基于 Redis 的策略,计数器存储格式发生了变化,且计数器 key 现在带版本号。既有计数器不会被迁移——它们会按各自的 TTL 自然过期——因此限流计数器会在升级时刻重置一次。(local 策略本就在重启时重置。)会有一个短暂的计数重置窗口,无需任何操作。
为了限制内存占用,多 个插件现在会在缓冲之前拒绝过大的请求体:
- hmac-auth:当启用
validate_request_body时,请求体大小由新增的max_req_body_size选项限制(默认524288字节,即 512 KiB)。 - forward-auth、ai-proxy、ai-proxy-multi:请求体大小由新增的
max_req_body_size选项限制(默认67108864字节,即 64 MiB),超过上限的请求会被以HTTP 413拒绝。
这些默认值高于 NGINX 默认的 client_max_body_size(1 MiB),因此大多数部署不受影响。如果你确实需要在使用这些插件的 route 上处理更大的请求体(并已相应调大 client_max_body_size),请将 max_req_body_size 调整到匹配的值。
在开发者门户中,凭据的 key-auth key 和 basic-auth password 现在仅在创建或重新生成凭据时返回一次,不再包含在凭据的读取或列表响应中,这与 OAuth client_secret 的现有行为一致。basic-auth 的用户名仍然可见。
请在密钥首次展示时复制并妥善保存。如果密钥丢失,请重新生成凭据以获得新值。任何从凭据读取或列表接口回读这些密钥的集成都需要改为在创建时 捕获它们。
独立的 apisix_llm_ttft 指标已被 apisix_llm_latency{type="ttft"} 取代,与 apisix_http_latency 的结构保持一致。如果你的 Prometheus 查询或 Grafana 看板引用了 apisix_llm_ttft,请改为选择 apisix_llm_latency 上 type 标签的 ttft 值。
新功能
插件
- Limit Count
- 此前仅
limit-count-advanced提供的高级限流能力,现在可直接在limit-count中使用:redis-sentinel策略、滑动窗口计数(window_type设为sliding)、在一份配置中设置多个独立限流(rules)、由 NGINX 变量驱动的count和time_window(例如按 consumer 的动态配额)、以及延迟 Redis 同步(sync_interval)。
- 此前仅
- AI 内容安全插件(
ai-aliyun-content-moderation、ai-aws-content-moderation、ai-prompt-guard)- 新增
fail_mode选项(skip、warn或error,默认skip),用于控制当插件绑定在 Consumer 级别、收到非 AI 或非 JSON 请求时的处理方式。skip会让这类请求不经检查直接放行;warn会额外记录一条警告日志;error则拒绝它们。这避免了 Consumer 级绑定的审核插件收到普通(非 AI)流量时报错。
- 新增
- AI Proxy
- 新增描述每个 LLM 请求的内置 NGINX 变量,可用于
access_log格式和 logger 插件:$llm_total_tokens、$llm_stream、$llm_has_tool_calls、$llm_tool_count、$llm_end_user_id、$llm_cache_read_input_tokens、$llm_cache_creation_input_tokens和$llm_reasoning_tokens。已为 OpenAI(Chat 与 Responses)、Anthropic 和 DeepSeek 提供映射。
- 新增描述每个 LLM 请求的内置 NGINX 变量,可用于
- Prometheus
- 新增 LLM 可观测性指标:按请求统计的 prompt token 和 completion token 分布直方图(
apisix_llm_prompt_tokens_dist、apisix_llm_completion_tokens_dist)、总延迟直方图,以及以apisix_llm_latency{type="ttft"}暴露的首 token 时间(TTFT,仅流式请求)。直方图的 bucket 可通过plugin_attr.prometheus配置。 - 为
http_status、http_latency和bandwidth指标新增mcp_request_type和mcp_tool_name标签,从而可以按请求类型(tools/list或tools/call)和工具名称拆分 MCP(Model Context Protocol)流量。这两个标签都可以通过disabled_labels关闭。 - 在指标日志阶段缓存 disabled-labels 映射,而不是每个请求都重建,降低了每请求开销。
- 新增 LLM 可观测性指标:按请求统计的 prompt token 和 completion token 分布直方图(
- AI Proxy Multi
- 为 fallback 机制新增
max_retries和retry_on_failure_within_ms。max_retries限制单个请求在失败后最多重试多少个额外实例;retry_on_failure_within_ms仅在上游于指定时间内失败时才进行 fallback,因此慢失败会直接返回给客户端,而不是再重试(避免长耗时 LLM 请求的延迟翻倍)。
- 为 fallback 机制新增
- OpenID Connect
- 在
session下暴露了lua-resty-session选项(cookie 的 name、path、domain、secure、http_only、same_site,以及 idling、rolling、absolute 超时),因此你可以自定义会话 cookie 名称并设置真正生效的会话有效期。旧的session.cookie.lifetime已废弃但仍被兼容(映射为absolute_timeout)。 - 对于只在本地校验 token、不调用身份提供方的流程(
bearer_only搭配public_key或use_jwks、private_key_jwt、以及公共客户端 PKCE),client_secret现在是可选的。会话/回调和 introspection 流程仍然必须提供它。
- 在
- Kafka Logger
- 为 Kafka 生产协议新增
api_version选项(0、1或2,默认1)。将api_version设为2可让 broker 记录真实的消息时间戳(Kafka 0.10 及以上);默认值1保留协议兼容性。
- 为 Kafka 生产协议新增
开发者门户
- 双因素认证:开发者可使用 TOTP 验证器 App 保护自己的账号。在账号安全设置中启用 2FA(确认密码、扫描二维码),也可在此关闭;启用后登录会要求输入六位验证码。
- 深色模式:门户支持浅色、深色和跟随系统三种主题,可通过页头的开关切换,应用于整个界面、API 用量图表和文档站,并在多次访问间保持。
- 平台管理后台:新增管理区域(仅限配置的管理员用户),其中的 Users 页面可列出、搜索和分页查看门户用户,修改用户角色、封禁或解封、删除用户;Organizations 页面可按用户成员关系筛选。
- 门户内审批:平台管理员可以在门户新增的 Approvals 页面中查看并处理开发者注册和 API Product 订阅申请。审批与 Dashboard 共享同一数据源,每次处理都会记录操作管理员的身份(Dashboard 的审批列表现在会为门户中做出的处理显示真实的管理员名称)。
- 基于策略的 SSO 登录:登录会根据所输入的邮箱把用户引导到正确的方式(密码、magic link 或 SSO)。管理员可以把邮箱域名映射到 SSO 提供方,并支持锚定、大小写不敏感的正则表达式模式,因此一条规则即可覆盖多个域名。
- 门户内文档站:门户现在在
/docs托管一个与门户风格一致的 Markdown 文档站,带可折叠侧边栏、目录、代码复制按钮、"Copy page" 菜单,以及带高亮匹配片段的内置全文搜索。 - 注册服务条款:新用户需要同意服务条款才能完成注册;服务条款 URL 可配置。
- 简化组织创建:「创建组织」对话框不再要求填写 slug——标识符会根据名称自动分配。
缺陷修复
插件
- JWT Auth
- 修复问题:当 token 的签名格式有误(长度不对或不是合法的 base64url)时,校验器会抛错并返回
HTTP 500,而不是拒绝请求。现在签名格式有误的 token 会以HTTP 401被拒绝。
- 修复问题:当 token 的签名格式有误(长度不对或不是合法的 base64url)时,校验器会抛错并返回
- AI Proxy
- 修复问题:在 passthrough 模式下,发往上游的请求总是以
POST发送,且丢弃了客户端的查询字符串,导致需要在其他方法上携带查询参数的提供方失败(例如 Azure OpenAI 的?api-version=)。现在会转发客户端的方法和查询字符串。 - 修复问题:访问上游 LLM 超时(例如 DNS 解析超时)时返回
HTTP 500而不是HTTP 504。现在上游 LLM 超时会正确返回HTTP 504。
- 修复问题:在 passthrough 模式下,发往上游的请求总是以
- AI Proxy Multi
- 修复问题:在按实例创建健康检查器之后,缓存的节点选择器没有重建,导致某个 worker 可能持续把部分流量路由到已被标记为不健康的实例;对配置了
auth.query或auth.header的实例,主动健康检查探测还可能破坏探测路径。这两个问题均已修复,故障转移和健康检查现在按配置工作。
- 修复问题:在按实例创建健康检查器之后,缓存的节点选择器没有重建,导致某个 worker 可能持续把部分流量路由到已被标记为不健康的实例;对配置了
- Graphql Proxy Cache
- 修复问题:在内存缓存增加
Vary支持后,PURGE请求只清除了旧的缓存槽,而保留了各Vary变体的缓存,因此在 TTL 过期前仍会返回过期响应。现在PURGE会清除所有变体。
- 修复问题:在内存缓存增加
- Body Transformer
- 修复问题:XML 转 JSON 时会在部分 worker 进程上间歇性丢失带命名空间的 key,导致 SOAP 转换以
attempt to index field 'Body' (a nil value)失败。现在带命名空间的 key 总能被保留。格式错误的 multipart 输入现在返回HTTP 400而不是HTTP 500。
- 修复问题:XML 转 JSON 时会在部分 worker 进程上间歇性丢失带命名空间的 key,导致 SOAP 转换以
- Kafka Logger
- 修复问题:由于无法配置 Kafka 生产 API 版本,broker 存储的消息没有可用的时间戳(显示为 1970-01-01)。将新增的
api_version设为2可让 broker 记录真实的时间戳。
- 修复问题:由于无法配置 Kafka 生产 API 版本,broker 存储的消息没有可用的时间戳(显示为 1970-01-01)。将新增的
- Elasticsearch Logger
- 修复问题:使用某些
{time_format}占位符的动态索引名可能生成被破坏的索引名。现在无效的时间格式会回退为空值(并记录日志),而不是破坏索引名。
- 修复问题:使用某些
- AWS Lambda
- 修复问题:使用 IAM(SigV4)认证时,查询字符串中包含需要转义的字符、多值或无值键会导致签名不匹配(
InvalidSignatureException)。现在规范查询字符串按 SigV4 规范构建。
- 修复问题:使用 IAM(SigV4)认证时,查询字符串中包含需要转义的字符、多值或无值键会导致签名不匹配(
- Proxy Mirror
- 修复问题:镜像 gRPC 请求时把内部 location 名称当作请求路径发送,导致镜像后端以
UNIMPLEMENTED拒绝每次调用。现在镜像请求使用原始的 gRPC 方法路径。
- 修复问题:镜像 gRPC 请求时把内部 location 名称当作请求路径发送,导致镜像后端以
- Request ID
- 修复问题:当
algorithm设为nanoid时,生成器会产生大量重复且格式错误的 ID,并且每生成一个 ID 就泄漏一个文件描述符。现已替换为基于 CSPRNG 的生成器;ID 格式不变,且 ID 现在唯一且格式正确。
- 修复问题:当
- OPA
- 修复问题:配置
send_headers_upstream时,OPA 服务未返回的某个头会在发往上游的请求中保留客户端传入的值,而不是被清除。现在这类头会被清除。
- 修复问题:配置
- SAML Auth
- 修复问题:调试日志被意外保持开启,且认证失败时可能放行请求而不是返回错误。现在已关闭调试模式,认证失败会返回明确的错误。
- CORS
- 修复问题:当配置了
allow_origins_by_regex时,没有Origin头的请求会返回HTTP 500。现在这类请求会被正常处理而不报错。
- 修复问题:当配置了
- Multi Auth
- 修复问题:当底层某个认证插件返回的状态没有错误信息时,插件返回
HTTP 500而不是HTTP 401。现在会返回HTTP 401。
- 修复问题:当底层某个认证插件返回的状态没有错误信息时,插件返回
- DingTalk Auth
- 修复问题:客户端可以传入伪造的
X-Userinfo头并被转发到上游。插件现在会在认证前清除客户端传入的X-Userinfo头,确保上游只收到由插件校验的身份信息。
- 修复问题:客户端可以传入伪造的
- Authz Casdoor
- 修复问题:登录会话没有绑定到 Casdoor token 的有效期,而是回退到会话库的默认值,导致会话可能比 token 存活更久。现在会话会在 Casdoor token 过期时一 并过期。
- CAS Auth
- 修复问题:单点登出的
POST请求体为空时返回HTTP 500而不是HTTP 400。现在空请求体的登出请求会被以HTTP 400拒绝。
- 修复问题:单点登出的
- Limit Conn
- 修复问题:由 NGINX 变量解析出的
burst值为0时会被以HTTP 500拒绝,尽管静态的burst为0是合法的。现在变量解析出的burst为0会被接受。
- 修复问题:由 NGINX 变量解析出的
- Limit Req
- 修复问题:在并发压力下,由于读取和写入不是原子操作,基于 Redis 的限流可能被突破。现在限流通过单次原子操作执行。
数据面
- 修复问题:Redis 连接此前仅按地址做连接池,因此指向同一 Redis 服务器但使用不同数据库、凭据或 TLS 设置的两份插件配置可能复用彼此的连接——例如
limit-count、limit-req或limit-conn的计数器可能被写到错误的 Redis 数据库。现在连接会按地址、数据库、凭据和 TLS 设置隔离,redis-sentinel策略同样如此。 - 修复问题:当
set_header使用与既有头不同的字母大小写调用后,缓存的头表会同时保留两个条目,导致遍历缓存头的插件(如ext-plugin-post-resp)可能把过期的值转发到上游。现在缓存头的 key 会被规范化。 - 修复问题:当
workflow插件运行在 global rule 中、而某个 route 插件在 rewrite 阶段就结束了请求(例如 CORS 预检)时,日志阶段会在每个这类请求上记录一条错误。现在缺少上下文时日志阶段会干净地提前返回。 - 修复问题:在启用 stream 子系统时启用 Nacos 服务发现,会因为 stream 子系统中未声明所需的共享字典而在启动时中止 stream worker;现在该字典已声明。另一个会把 Nacos 注册创建失败变成 worker 崩溃的错误处理缺陷也已修复。
- 修复问题:使用 Consul 服务发现时,单个格式错误的节点条目会导致该 service 其余节点被丢弃(甚至可能丢弃整个 service,产生 "no valid upstream node")。现在只会跳过无效的那个节点。
- 修复问题:当 AWS Secrets Manager 的密钥名称包含斜杠时,解析会失败,因为查找在第一个斜杠处就做了切分。现在包含斜杠的密钥名称可以正确解析。
- 修复问题:Admin API 的
PATCH会对已加密的插件字段重复加密,因此对任意字段做一次PATCH都可能损坏已存储的密钥(如key-auth的 key)。现在已加密字段会在合并前解密,并只重新加密一次。
开发者门户
- 修复问题:组织邀请未遵循邮箱验证设置。现在邀请会遵循所配置的邮箱验证行为。
- 修复问题:对于属于多个组织的开发者,门户可能使用错误的组织上下文。现在开发者身份会从当前激活的组织解析。
- 修复问题:门户中多处对话框宽度不一致;现已统一。
3.10.0
发布日期:2026-06-01
不兼容变更
插件
-
升级说明
hmac-auth插件现在将signed_headers默认设为["date"]。数据面升级后,任何未显式设置signed_headers的hmac-auth配置都要求客户端签名覆盖Date头。此前未对Date签名的客户端将开始收到HTTP 401,错误信息为client request can't be validated。升级前,请确保客户端对
Date头签名,或在插件配置中显式设置signed_headers以匹配客户端实际签名的头。
控制面
-
移除 Service Template 与 API 发布机制
升级说明Service Template / Service Hub 模型已被移除。Service 现在直接归属于 Gateway Group,并通过 APISIX Admin API 管理——不再有独立的模板、发布、版本、回滚和 runtime 配置层。在控制台中,Service Hub 区域被各 Gateway Group 下的 Services 列表取代。
控制面升级到 3.10.0 时,既有的 service template 和 published service 会自动迁移到新的直连 service 模型。原始数据会被保留(不会删除),因此升级可以回滚。引用 service-template 或 published-service ARN 的 IAM 权限策略会被自动备份并重写。
开发者门户
-
仅对已发布的 API Product 强制开发者认证
升级说明此前,处于**草稿(draft)状态的 API Product 也会把其开发者认证规则同步到网关,因此草稿 产品下的 route 也会要求开发者认证。从 3.10.0 起,只有已发布(published)**的 API Product 才会向数据面下发开发者认证规则。
升级后,属于草稿(未发布)API Product 的 route 在产品发布之前不再要求开发者认证。如果你依赖草稿产品被保护,请发布它们,或通过其他方式限制访问。
升级须知
数据面网关 runtime 已从 OpenResty 1.21.4.4 升级到 OpenResty 1.29.2.4,并改为基于开源 apisix-runtime 构建。本次升级的主要目的是跨越多个大版本,引入上游 NGINX 内核、OpenSSL、LuaJIT 及内置依赖库的最新 安全修复。
大多数部署无需任何操作。一个可见的变化是:HTTP/2 现在通过 NGINX 1.25+ 的 http2 on; 指令启用,而不再使用 per-listen 的 http2 参数;HTTP/2 over cleartext(h2c)和 over TLS 仍照常工作。如果你维护了自定义的 NGINX 配置片段,请在升级前确认它们与较新版本的 NGINX 兼容。
当数据面启用数据加密(apisix.data_encryption.enable: true)时,以下插件的 secret_fallbacks 字段现在会在落盘时加密存储(在原有已加密字段之外新增):
- feishu-auth:
secret_fallbacks - dingtalk-auth:
secret_fallbacks
只有这些凭据的落盘表示(etcd / 备份 / 导出)从明文变为密文,Admin API 返回的值不变。由于控制面一升级就会加密这些字段,请将数据面与控制面一起升级(或在依赖该加密前先升级数据面)——新控制面搭配尚不解密这些字段的旧 3.9.13 数据面时,会把密文透传给上游。如果你未启用数据加密,则没有任何变化。
新功能
插件
- AI Proxy
- 上游 LLM 请求体现在使用排序后的 key 进行 JSON 编码。这会为等价请求生成稳定、逐字节一致的请求体,从而提升按精确请求体缓存的 LLM 提供商的 prompt-cache 命中率。
- AI Proxy Multi
- 当 LLM endpoint 域名解析到多个 A 记录时,插件现在会解析全部 A 记录并构建多节点 upstream,逐请求选择节点以获得更好的负载分布和故障转移。
Host头和 TLS SNI 保留原始域名,而不是解析出的 IP 地址。
- 当 LLM endpoint 域名解析到多个 A 记录时,插件现在会解析全部 A 记录并构建多节点 upstream,逐请求选择节点以获得更好的负载分布和故障转移。
- Proxy Cache
- 内存缓存策略现在支持
Vary响应头。响应会按Vary中列出的头计算出的变体分别缓存,Vary: *的响应不会被缓存。
- 内存缓存策略现在支持
- CAS Auth
cas_callback_uri现在支持绝对 URL,并原样用作 CAS service URL。当网关位于代理之后、对外可见的 callback URL 与请求路径不同时,这非常有用。
控制台(Dashboard)
- 新增权限策略语句的可视化编辑器。现在你可以通过选择资源类型、操作(标注了访问级别)和条件来构建 IAM 策略,无需手写策略 JSON。
- 配置兼容性告警现在会展示每个受影响资源的完整业务层级路径(例如 gateway group → service → route),而不是裸资源 ID,更便于定位需要处理的配置。
缺陷修复
插件
- Error Page
- 修复问题:插件此前根据 upstream status 变量判断是否渲染自定义错误页,可能会替换掉真正来自上游服务的错误响应。现在插件会判定响应来源——只对网关或插件产生的错误(如上游连接失败或被插件拒绝的请求)渲染自定义错误页,而真正由上游返回的错误响应会原样透传,保留上游的原始响应体。
- Feishu Auth
- 修复问题:客户端可以传入伪造的
X-Userinfo头并被转发到上游。插件现在会在认证前清除客户端传入的X-Userinfo头,确保上游只收到由插件校验的身份信息。
- 修复问题:客户端可以传入伪造的
- CAS Auth
- 修复问题:登录回调未校验已签名的发起 cookie,使得构造的回调请求可以操纵登录后的跳转目标(CSRF / open-redirect)。回调现在要求携带有效的已签名发起 cookie,否则以
HTTP 401拒绝。
- 修复问题:登录回调未校验已签名的发起 cookie,使得构造的回调请求可以操纵登录后的跳转目标(CSRF / open-redirect)。回调现在要求携带有效的已签名发起 cookie,否则以
- DingTalk Auth
- 修复问题:认证失败与上游瞬时失败未做区分。插件现在对认证错误返回
HTTP 401,对 DingTalk 或上游的瞬时失败返回HTTP 503,并提供更清晰的错误信息。
- 修复问题:认证失败与上游瞬时失败未做区分。插件现在对认证错误返回
- Authz Casdoor
- 修复问题:session cookie 名称在不同 Casdoor client 间共享,导致不同 client 的 session 可能冲突。session cookie 现在按 client(基于
client_id)隔离命名。
- 修复问题:session cookie 名称在不同 Casdoor client 间共享,导致不同 client 的 session 可能冲突。session cookie 现在按 client(基于
- Authz Keycloak
- 修复问题:当静态
permissions与http_method_as_scope同时使用时,派生出的方法 scope 会被写回复用的插件配置,导致 scope 跨请求累积。现在会在追加方法 scope 之前先克隆 permission 列表。
- 修复问题:当静态
- GraphQL Limit Count
- 修复问题:查询嵌套深度计算有误,导致基于深度的限流不准确。现在深度会按真实最大嵌套深度并展开 fragment 计算。Content-Type 匹配也容忍 charset 参数(如
application/json; charset=utf-8),此前这类请求会被拒绝。
- 修复问题:查询嵌套深度计算有误,导致基于深度的限流不准确。现在深度会按真实最大嵌套深度并展开 fragment 计算。Content-Type 匹配也容忍 charset 参数(如
- GraphQL Proxy Cache
- 修复问题:
Content-Type带 charset 参数的请求未被识别为 GraphQL 请求。Content-Type 匹配现在容忍 charset,同时增加了 nil 守卫、更清晰的错误信息并修正了日志级别。
- 修复问题:
数据面
- 修复问题:当同一请求上有多个日志插件抓取响应体时(例如
http-logger和file-logger都启用了include_resp_body),它们的响应体缓冲区可能相互干扰,产生截断或混杂的日志输出。现在每个 logger 使用独立的缓冲区。
3.9.14
发布日期:2026-06-15
不兼容变更
插件
-
升级说明
jwt-auth现在默认校验 token 的exp(过期)和nbf(生效时间)声明。此前,未设置claims_to_verify(或将其设为空列表)的 consumer 会接受任何签名正确的 token,包括已过期的 token。数据面升级后,这类 token 会被以HTTP 401拒绝。如果你依赖已过期 token 仍被接受,请在升级前评估此行为变更。如需只校验特定声明,请在 consumer 配置中显式设置
claims_to_verify。 -
升级说明
hmac-auth插件现在将signed_headers默认设为["date"]。数据面升级后,任何未显式设置signed_headers的hmac-auth配置都要求客户端签名覆盖Date头。此前未对Date签名的客户端将开始收到HTTP 401,错误信息为client request can't be validated。升级前,请确保客户端对
Date头签名,或在插件配置中显式设置signed_headers以匹配客户端实际签名的头。 -
Batch Requests
升级说明batch-requests插件现在会限制批量请求的规模。流水线子请求的数量由新增的插件元数据选项max_pipeline_items限制(默认1000),超过上限的批量请求会被以HTTP 400拒绝。包含文档之外字段的流水线条目现在会被拒绝,且每批的timeout至少为1毫秒。如果你发送的批量请求超过 1000 个子请求,请在插件元数据中调大
max_pipeline_items。如果客户端发送了未文档化的条目字段,请在升级前移除它们。
开发者门户
-
仅对已发布的 API Product 强制开发者认证
升级说明此前,处于**草稿(draft)状态的 API Product 也会把其开发者认证规则同步到网关,因此草稿产品下的 route 也会要求开发者认证。从 3.9.14 起,只有已发布(published)**的 API Product 才会向数据面下发开发者认证规则。
升级后,属于草稿(未发布)API Product 的 route 在产品发布之前不再要求开发者认证。如果你依赖草稿产品被保护,请发布它们,或通过其他方式限制访问。
升级须知
forward-auth、ai-proxy 和 ai-proxy-multi 插件在读取请求体时现在会强制 max_req_body_size 上限(默认 64 MB)。请求体超过上限时会以 HTTP 413 Request Entity Too Large 拒绝。
如果你通过这些插件代理较大的请求体,请在升级前显式将 max_req_body_size 设为适配你业务的值。
控制面现在会在存储时加密更多保存凭证的插件字段。由于 API7 EE 升级时先升级控制面、再升级数据面,在升级间隙中,3.9.14 的控制面会加密这些字段,而仍为 3.9.13 的旧数据面无法解密,可能导致相关插件失效,直到数据面也完成升级。
本次新增加密的字段,按插件列出如下:
- AI AWS Content Moderation:
comprehend.secret_access_key - Azure Functions:
master_apikey、authorization.apikey - DingTalk Auth:
secret_fallbacks - Error Log Logger:
kafka.brokers.sasl_config.password - Feishu Auth:
secret_fallbacks - HTTP Logger:
auth_header - Kafka Logger:
brokers.sasl_config.password - Loggly:
customer_token - OpenFunction:
authorization.service_token - OpenID Connect:
session.secret - Splunk HEC Logging:
endpoint.token
如果你使用了上述插件的相关字段,请在控制面升级后尽快将数据面升级到 3.9.14 ,并在两侧都升级到 3.9.14 之前避免编辑这些插件。
新功能
插件
- Limit Count
- 此前由
limit-count-advanced提供的高级限流能力现已内置到limit-count。你可以配置滑动窗口(window_type设为sliding)、redis-sentinel策略、多条限流规则(rules)、由请求变量推导的count,以及通过group和sync_interval实现的共享计数器。独立的limit-count-advanced插件仍保留以兼容旧配置。
- 此前由
- AI Proxy
- 上游 LLM 请求体现在使用排序后的 key 进行 JSON 编码。这会为等价请求生成稳定、逐字节一致的请求体,从而提升按精确请求体缓存的 LLM 提供商的 prompt-cache 命中率。
- AI Proxy Multi
- 新增
max_retries以限制 fallback 重试次数,以及retry_on_failure_within_ms,使得只有在配置时间窗内发生的失败才触发 fallback。慢速失败会直接返回客户端,避免在多个 fallback 实例间成倍累加等待时间。
- 新增
- AI Prompt Guard 及各 AI 内容审核插件
- 新增
fail_mode(skip、warn或error,默认skip),用于控制 consumer 绑 定的插件在遇到无法识别格式的请求时的行为:skip放行请求,warn放行并记录日志,error以HTTP 400拒绝。
- 新增
- OpenID Connect
- 新增对
lua-resty-session的 session 选项支持(如cookie_name、cookie_path),从而可以自定义 session cookie。 - 对于本地 JWT 校验模式(例如
bearer_only配合public_key、use_jwks或private_key_jwt),client_secret现在为可选项,因为这些模式不需要 client secret。
- 新增对
- CAS Auth
cas_callback_uri现在支持绝对 URL,并原样用作 CAS service URL。当网关位于代理之后、对外可见的 callback URL 与请求路径不同时,这非常有用。
- Proxy Cache
- 内存缓存策略现在支持
Vary响应头。响应会按Vary中列出的头计算出的变体分别缓存,Vary: *的响应不会被缓存。
- 内存缓存策略现在支持
- Kafka Logger
- 新增
api_version选项(Produce API 版本0、1或2)。将其设为2后,消息时间戳会被携带并由 broker 存储;否则消息可能在记录时缺少时间戳。
- 新增
数据面
- 新增面向 AI 请求的内建 NGINX 变量(
$llm_model、$request_llm_model、$llm_prompt_tokens、$llm_completion_tokens、$llm_total_tokens、$llm_time_to_first_token、$llm_stream),可在 NGINX access log 格式中引用,以记录每个请求的 LLM 模型和 token 用量。 - Prometheus 插件现在导出 LLM token 分布直方图(
apisix_llm_prompt_tokens_dist和apisix_llm_completion_tokens_dist),以及包含首 token 时间(type="ttft")的apisix_llm_latency直方图。 - Prometheus 插件现在为 HTTP 指标增加 MCP 工具维度(
mcp_tool_name和mcp_request_type),从而可以按工具和请求类型拆分 MCPtools/call流量。
开发者门户
- 为开发者门户新增**审批(Approvals)**流程。平台管理员可以在门户中审核并接受或拒绝 API Product 订阅和开发者注册请求,申请人的组织名称会被解析以便展示。执行操作的管理员会被记录为操作者以便审计,Dashboard 也会展示解析后的操作者。
- 凭证密钥(如 key-auth、basic-auth 的 key)现在只在创建时返回一次。后续读取凭证时不再包含密钥值。
- 新增管理员**用户(Users)**页面,用于管理门户用户——列表、搜索、修改角色、封禁/解封以及删除。
- 新增门户登录的双因素认证(2FA)。
- 新增基于策略的 SSO 登录:可根据开发者的邮箱域名将其路由到指定的 SSO 提供方,支持锚定的、大小写不敏感的正则表达式匹配。
- 新增注册时可配置的服务条款(Terms of Service)确认步骤。
- 新增暗色模式。
缺陷修复
插件
- Error Page
- 修复问题:插件此前根据 upstream status 变量判断是否渲染自定义错误页,可能会替换掉真正来自上游服务的错误响应。现在插件会判定响应来源——只对网关或插件产生的错误渲染自定义错误页,而真正由上游返回的错误响应会原样透传。
- Feishu Auth 和 DingTalk Auth
- 修复问题:客户端可以传入伪造的
X-Userinfo头并被转发到上游。两个插件现在都会在认证前清除客户端传入的X-Userinfo头,确保上游只收到由插件校验的身份信息。
- 修复问题:客户端可以传入伪造的
- DingTalk Auth
- 修复问题:认证失败与上游瞬时失败未做区分。插件现在对认证错误返回
HTTP 401,对 DingTalk 或上游的瞬时失败返回HTTP 503,并提供更清晰的错误信息。
- 修复问题:认证失败与上游瞬时失败未做区分。插件现在对认证错误返回
- CAS Auth
- 修复问题:登录回调未校验已签名的发起 cookie,使得构造的回调请求可以操纵登录后的跳转目标。回调现在要求携带有效的已签名发起 cookie,否则以
HTTP 401拒绝。 - 修复问题:单点登出(SLO)的空 body
POST请求此前返回HTTP 500,现在返回HTTP 400。
- 修复问题:登录回调未校验已签名的发起 cookie,使得构造的回调请求可以操纵登录后的跳转目标。回调现在要求携带有效的已签名发起 cookie,否则以
- Authz Casdoor
- 修复问题:session cookie 名称在不同 Casdoor client 间共享,导致不同 client 的 session 可能冲突 。session cookie 现在按 client 隔离命名。
- 修复问题:网关 session 未与 Casdoor token 的生命周期绑定,token 过期后仍可能被复用。现在 session 会在 Casdoor token 过期时失效,强制重新认证。
- Authz Keycloak
- 修复问题:当静态
permissions与http_method_as_scope同时使用时,派生出的方法 scope 会被写回复用的插件配置,导致 scope 跨请求累积。现在会在追加方法 scope 之前先克隆 permission 列表。
- 修复问题:当静态
- OPA
- 修复问题:对于在
send_headers_upstream中列出但 OPA 响应中未返回的头,客户端传入的值可能被转发到上游。现在这类头会被清除,确保只有 OPA 提供的值到达上游。
- 修复问题:对于在
- SAML Auth
- 修复问题:重构了插件加载和错误处理——移除了
load_resty_samlwrapper,默认关闭 debug 输出,并在认证出错时返回干净的HTTP 500。
- 修复问题:重构了插件加载和错误处理——移除了
- AI Proxy
- 修复问题:上游 LLM 超时此前被映射为
HTTP 500,现在映射为HTTP 504 Gateway Time-out。 - 修复问题:在 passthrough 模式下,客户端的 HTTP 方法和查询字符串未被转发到上游。现在它们会被保留。
- 修复问题:上游 LLM 超时此前被映射为
- AI Proxy Multi
- 修复问题:基于域名的 upstream 健康检查可能不稳定——缓存的节点选择器在健康检查器创建后可能变陈旧,且健康检查配置可能在请求间被就地修改。
- GraphQL Limit Count
- 修复问题:查询嵌套深度计算有误,导致基于深度的限流不准确。现 在深度会按真实最大嵌套深度并展开 fragment 计算,Content-Type 匹配也容忍 charset 参数。
- GraphQL Proxy Cache
- 修复问题:
Content-Type带 charset 参数的请求未被识别为 GraphQL 请求。Content-Type 匹配现在容忍 charset。 - 修复问题:
PURGE请求未清除缓存条目的所有Vary变体。现在所有变体都会被清除。
- 修复问题:
- AWS Lambda
- 修复问题:对带 URL 编码或多值查询参数的请求,IAM(SigV4)认证因 canonical query string 计算错误而失败。
- AWS Secret Manager
- 修复问题:解析名称中包含斜杠的 secret 会失败。现在这类名称可以被正确解析。
- Request ID
- 修复问题:
nanoid算法可能产生重复或非法的 ID。现在 ID 使用密码学安全的随机源生成,并始终使用合法的 nanoid 字母表。
- 修复问题:
- Proxy Mirror
- 修复问题:镜像 gRPC 请求时,原始的 method path 未在镜像请求中保留。现在它会被完整保留。
- Body Transformer
- 修复问题:XML 转 JSON 时,使用 XML 命名空间前缀的 key 偶尔会丢失。现在带命名空间的 key 会被保留并可在模板中访问。
- Elasticsearch Logger
- 修复问题:使用日期占位符的动态索引模板在模板非法时可能报错。现在日期格式化已加守卫。
- 限流插件(Limit Count、Limit Req、Limit Conn)
- 修复问题:仅在 database 编号或凭证上不同的 Redis 连接可能共享同一 keepalive 连接池,导致连接被复用到错误的 database 或身份上。现在连接会按 database、凭证和 TLS 设置隔离;这也覆盖了
redis-sentinel策略。
- 修复问题:仅在 database 编号或凭证上不同的 Redis 连接可能共享同一 keepalive 连接池,导致连接被复用到错误的 database 或身份上。现在连接会按 database、凭证和 TLS 设置隔离;这也覆盖了
- Limit Conn
- 修复问题:解析后为
0的动态burst值此前被错误地判为非法。现在它被允许。
- 修复问题:解析后为
数据面
- 修复问题:当同一请求上有多个日志插件抓取响应体时,它们的响应体缓冲区可能相互干扰,产生截断或混杂的日志输出。现在每个 logger 使用独立的缓冲区。
- 修复问题:部分 logger 插件写入的 debug 日志可能泄漏凭证。这些日志已被移除。
- 修复问题:当 access 阶段被短路(例如被认证拒绝)时,log 阶段的日志插件可能失败。
- 修复问题:当插件用不同大小写设置同一个头时,缓存的请求头可能保留陈旧值。现在头的缓存键会被归一化。
- 修复问题:
consul服务发现在某个节点条目无效时会丢弃该 service 的其余所有节点。现在无效节点会被逐个跳过,其余健康节点仍会被使用。 - 修复问题:
nacos服务发现在 stream 子系统中因所需的共享字典未在该子系统声明而失败。
控制面
- 修复问题:
openid-connect允许省略client_secret的豁免适用范围过宽。现在该 豁免被限定到确实不需要 client secret 的 OIDC flow。 - 修复问题:按 gateway group 维度列出 label 时,返回的是该资源类型的全局 label,而不是限定到该 gateway group 的 label。
- 修复问题:开发者门户的组织邀请未遵循所配置的邮箱验证要求。
3.9.13
发布日期:2026-05-22
不兼容变更
插件
-
CAS Auth
升级说明cas-auth插件现在要求配置长度至少为 32 个字符的cookie.secret。插件使用该密钥对CAS_REQUEST_URIcookie 进行 HMAC 签名和校验,防止客户端可控 cookie 修改登录后的跳转目标。升级前,请为所有已有
cas-auth配置补充cookie.secret,并确保所有网关节点使用相同密钥。
升级须 知
proxy-cache 和 graphql-proxy-cache 插件现在默认使用更安全的缓存行为。
对于 proxy-cache,当请求存在已认证 consumer 或 remote user 时,缓存会按 consumer 隔离,除非配置的 cache_key 已经包含身份相关变量。内存缓存策略也不再缓存上游 Cache-Control 包含 private、no-store 或 no-cache 的响应;内存和磁盘缓存策略都默认跳过带 Set-Cookie 的响应,除非设置 cache_set_cookie: true。
对于 graphql-proxy-cache,缓存键默认包含 host、route、service 和 consumer 身份,带 Set-Cookie 的响应默认也会被跳过,除非设置 cache_set_cookie: true。
如果你确实需要跨 consumer 共享缓存,请设置 consumer_isolation: false。如果你确实需要缓存带 Set-Cookie 的响应,请设置 cache_set_cookie: true。
新功能
插件
- AI Proxy
- 优化 OpenAI 兼容流式响应吞吐,降低逐 token flush 和 SSE 解析开销。在使用 mock OpenAI 上游的内部单 worker benchmark 中,峰值流式吞吐从 44,102.6 tokens/s 提升到 138,158.7 tokens/s,约提升 3.13 倍。
- 优化使用
post_arg.*路由变量的 AI 大 JSON 请求体处理。在 1 MB、5 MB、10 MB OpenAI Chat Completions 兼容请求体的内部 benchmark 中,当网关透传原始请求体时吞吐提升 5.15-5.35 倍;当网关转发前改写请求体时吞吐提升 2.47-2.67 倍。 - 新增
streaming_flush_interval_ms,用于控制流式响应的周期性 flush。默认值为 10 ms,可降低逐 chunk flush 开销,同时保持有界的流式响应延迟。
- OpenAPI to MCP
- 新增
allowed_hosts,用于限制动态解析后的base_url可访问的目标主机。未配置allowed_hosts时,既有行为不变。插件现在也会对解析后的 URL 进行校验,对非法 URL 或非 HTTP(S) scheme 返回 HTTP 400。
- 新增
- Proxy Cache 和 GraphQL Proxy Cache
- 新增
consumer_isolation和cache_set_cookie选项,用于控制升级说明中描述的更安全缓存行为。
- 新增
控制面
- Alert Policy 现在支持在告警条件触发时自动创建 Debug Session。Alert History 会记录 Debug Session 创建是否成功,并包含创建出的 session ID 或错误详情。
- Fallback Control Plane 存储现在支持 S3-compatible path-style endpoint,可用于 MinIO 等要求 bucket 名称出现在 URL path 中的 S3 兼容服务。
控制台(Dashboard)
- Gateway Group 下新增 Debug Sessions UI,包括 session 列表、创建、停止、删除、trace 列表、trace waterfall 详情、搜索和过滤、minimap、URL 状态同步、字段格式化和键盘导航。
- 删除/停用确认弹窗新增复制按钮,用户可在执行破坏性操作前复制资源标识。
- 监控页面的 service 和 route 选择器支持搜索。
开发者门户
- 新增用于在 Kubernetes 中部署 Developer Portal 的 Helm chart。
缺陷修复
插件
- OpenID Connect
- 修复问题:客户端传入的身份头(
X-Access-Token、X-Userinfo、X-ID-Token、X-Refresh-Token)可能被转发到上游,而不是使用插件校验后的值。现在这些头会被清除 或覆盖,确保上游只收到由插件控制的身份信息。
- 修复问题:客户端传入的身份头(
- Data Mask
- 修复问题:插件在处理多值 query 参数、无值 query 参数、非字符串 JSON 值、regex 失败和表单解析错误时可能崩溃或产生错误脱敏结果。regex 替换失败时也不再把原始敏感值写入日志。
- ACL
- 修复问题:
external_user_label_field_parser和external_user_label_field_separator可能错误地应用到 consumer labels,导致错误的允许或拒绝决策。现在它们只用于 external-user label 提取路径。
- 修复问题:
- Chaitin WAF 和 Wolf RBAC
- 修复问题:插件向后端服务发送客户端 IP 时使用了客户端可伪造的原始 IP 请求头。现在改为使用网关解析后的可信真实客户端 IP。
- Client Control
- 修复问题:当 Global Rule 插件在 access 阶段读取请求体时,路由或服务上的
client-control无法先应用请求体大小覆盖,导致大请求被意外拒绝。
- 修复问题:当 Global Rule 插件在 access 阶段读取请求体时,路由或服务上的
控制面
- 修复问题:删除仍被其他资源引用的 Secret 会留下悬空引用,并可能导致网关运行时错误。现在 Secret 仍存在引用时会拒绝删除。
- 修复问题:当
dp_manager_address同时包含域名和 IP 地址时,Data Plane Manager 证书可能无法通过旧版 Data Plane 的主机名校验。 - 修复问题:心跳上报中的非法网关版本字符串可能导致兼容性校验崩溃。现在会将其作为不兼容版本处理,而不是 触发 panic。
- 修复问题:非法的 stream route CIDR/IP 值和非法的
post_arg.*JSON path 表达式可能被控制面接受,随后在数据面被拒绝或丢弃。现在这些配置会在 API 层被拒绝。 - 修复问题:解密
AesEncrypt字段失败时,敏感加密字段值可能出现在日志中。现在日志只记录值长度。
数据面
- 修复问题:引用 service 的 stream route 可能持续使用旧的 service 级插件配置,直到 route 变更或 worker 重启。
- 修复问题:etcd 或 DP Manager 响应缺少预期 revision header 时,网关 worker 可能在启动阶段崩溃。现在网关会记录问题并重试。
- 修复问题:启用 status report 时,stream worker 可能在配置同步期间崩溃。
- 修复问题:标准网关 runtime 镜像缺少时区数据,导致
TZ环境变量对 IANA 时区名称不生效。 - 修复问题:启用 tracing 时,tracer 可能在 HTTPS 或 HTTP/2 keepalive 连接上崩溃。
- 修复问题:网关 CLI 将控制面 mTLS client certificate 文件写入系统临时目录,且权限过宽。现在这些文件会写入网关配置证书目录,并使用更严格的权限。
控制台(Dashboard)
- 修复问题:OpenID Connect 插件代码编辑器在小视口或高缩放比例下可能折叠或无法访问。
- 修复问题:从服务列表删除 Published Service 成功后,可能显示误导性的 "service not found" 错误 toast。
- 修复问题:一个页面可能修改列表表格默认值,并将非法排序参数泄漏到 Gateway Instances 页面。
- 修复问题:插件查看抽屉在 local、global 和 metadata 标签页之间切换时,可能显示过期或错误的 JSON。
- 修复问题:缓存的 gateway group 或 portal ID 不存在时,页面可能空白或显示 404 错误 toast,而不是跳转到有效的兜底资源。
3.9.12
发布日期:2026-05-08
新功能
插件
- AI Proxy
- 新增 AWS Bedrock 提供商支持,使用 Converse API。通过配置
"provider": "bedrock"、auth.aws中的 AWS IAM 凭证和provider_conf.region中的 AWS 区域即可使用。支持非流式和流式(ConverseStream)两种模式——在请求体中设置"stream": true即可获取流式响应。
- 新增 AWS Bedrock 提供商支持,使用 Converse API。通过配置
- OAS Validator
- 新增
spec_url字段,支持从远程 HTTP(S) URL 加载 OpenAPI 规范,替代在插件配置中内嵌完整 JSON 字符串。当规范文件超过spec字段的 2 MB 内联大小限制时特别有用。获取的规范使用可配置的 TTL 进行缓存(默认 1 小时,通过插件元数据spec_url_ttl设置),过期条目在后台刷新期间继续提供服务。另提供spec_url_request_headers(自定义 HTTP 头,如用于认证)和timeout(请求超时,毫秒,默认 10000)字段。spec和spec_url互斥。
- 新增
缺陷修复
插件
- File Logger
- 修复问题:当路由同时配置了
gzip插件和file-logger(启用include_resp_body)时,file-logger错误地尝试解压响应体。由于 APISIX 自身执行了 gzip 编码,日志器可用的响应体仍然是明文,导致产生虚假的inflate gzip err: INFLATE: data error日志条目,并且日志输出中丢失了响应体内容。
- 修复问题:当路由同时配置了
- Elasticsearch Logger
- 修复问题:使用日期时间占位符的动态索引模式(如
gateway-{%Y.%m.%d})在第一个请求后停止轮转。解析后的日期字符串被回写到共享配置对象中,永久覆盖了模板,直到工作进程重启。
- 修复问题:使用日期时间占位符的动态索引模式(如
- OAS Validator
- 修复问题:请求头参数校验区分大小写,当请求中的头名称大小写与 OpenAPI 规范定义不完全匹配时(例如发送
X-Request-Id而规范定义的是x-request-id),请求会 被拒绝。现已按照 RFC 7230 §3.2 实现大小写不敏感匹配。
- 修复问题:请求头参数校验区分大小写,当请求中的头名称大小写与 OpenAPI 规范定义不完全匹配时(例如发送
3.9.11
发布日期:2026-04-30
升级须知
本版本将 secret 引用($secret://、$env://)扩展为所有插件集中支持。升级控制面到 3.9.11 后,如果在之前不支持 secret 引用的插件字段中配置了 secret 引用,仍运行 3.9.10 或更早版本的数据面将不会解析这些引用——它会将字面量 $secret://... 字符串传递给插件。
推荐升级路径:在配置新支持的插件字段中的 secret 引用之前,先将所有数据面升级到 3.9.11。之前已支持 secret 的插件(jwt-auth、openid-connect、limit-count、authz-keycloak、csrf、limit-req、limit-conn)不受影响。
新功能
插件
- AI Proxy
- 新增 passthrough 协议适配器,可将无法识别的 API 格式(如
/v1/images/generations)透传至上游而不进行转换。此前,不匹配已知协议(OpenAI Chat、Completions、Embeddings 等)的请求会被拒绝。 - 使用白名单构建方式重写了 Anthropic 到 OpenAI 的协议转换器。这防止了 Anthropic 特有字段(如
metadata、top_k、thinking、output_config)泄漏到 OpenAI 兼容的上游提供商,并改善了工具调用、系统提示和多模态内容的转换准确性。 - 当 ai-proxy 使用 cosocket 传输调用 LLM 后端时,访问日志中的上游 nginx 变量(
$upstream_status、$upstream_addr、$upstream_response_time、$upstream_header_time、$upstream_connect_time、$upstream_response_length)现在能正确填充。此前由于绕过了 nginx 的 upstream 模块,这些变量为空。
- 新增 passthrough 协议适配器,可将无法识别的 API 格式(如
- OAS Validator
- 用纯 Lua 实现(
lua-resty-openapi-validator)替换了基于 Go FFI 的 OpenAPI 验证器。基于真实大规模 OpenAPI 规范(Stripe,约 414 个端点)的内部基准测试显示,新验证器每次请求校验快 2-7 倍,规范编译快 20 倍,同时消除了 Go 共享库从而减小了网关镜像体积。新验证器还修复了路径参数路由、nullable schema、allOf/anyOf 合并的正确性问题,并新增了对 form-encoded 请求体校验的支持(此前实现无法处理)。
- 用纯 Lua 实现(
- 所有插件现在自动支持在任何配置字段中使用
$secret://和$env://引用。此前仅少数插件 (jwt-auth、openid-connect、limit-count、authz-keycloak、csrf、limit-req、limit-conn)显式支持 secret 引用。这消除了每个插件单独实现 secret 解析的需要。
数据面
- 新增 distroless 网关镜像变体(
api7-ee-3-gateway-distroless)。该镜像从零构建,仅包含运行网关所需的共享库、CA 证书和时区数据,消除了运行时未使用但携带 CVE 的操作系统包。
控制台(Dashboard)
- 配置兼容性警告和错误现在通过数据面实例卡片上的可点击徽章单独显示。点击徽章打开一个详细模态框,展示所有配置问题的表格(资源类型、ID、严重级别和消息),便于识别和解决配置 schema 问题,而不会与版本兼容性状态混淆。
缺陷修复
插件
- AI Proxy Multi
- 修复问题:控制面推送配置更新后,健康检查验证记录大量噪声警告日志(
unable to construct upstream for plugin: ai-proxy-multi),因为 DNS 解析状态在配置表替换时丢失。
- 修复问题:控制面推送配置更新后,健康检查验证记录大量噪声警告日志(
- AI Rate Limiting
- 修复问题:包含点号的 AI 实例名称(如
Qwen3.5-397B-10.249.238.157)导致 HTTP 500 错误,因为名称被错误地解析为ctx.var路径表达式而非常量键。
- 修复问题:包含点号的 AI 实例名称(如
- AI Request Rewrite
- 修复问题:无请求体的请求产生模糊的上游错误,而非返回明确的 HTTP 400 Bad Request。
- AI Prompt Template
- 修复问题:JSON 解析错误消息显示为混乱的 Lua 表引用(如
table: 0x...),而非可读的错误字符串。
- 修复问题:JSON 解析错误消息显示为混乱的 Lua 表引用(如
- OpenTelemetry
- 修复问题:
additional_attributes中的非字符串值(如来自 nginx 变量的数字或布尔值)被 OpenTelemetry SDK 静默丢弃。现在在添加到 span 之前会强制转换为字符串。
- 修复问题:
- Limit Count
- 修复问题:Redis 凭证(
redis_password、redis_username、sentinel_password)被嵌入速率限制分组键中,在 Redis 键空间和 APISIX 日志中暴露敏感信息。
- 修复问题:Redis 凭证(
- Traffic Split (Stream)
- 修复问题:在 stream(L4)上下文中
ctx.var.route_id始终返回 nil,导致 traffic-split 规则中基于route_id的匹配条件永远无法生效。 - 修复问题:在 stream 上下文中,traffic-split 通过
upstream_id选择的上游被忽略,始终使用路由原始的上游。
- 修复问题:在 stream(L4)上下文中
控制面
- 修复问题:配置兼容性报告中的警告级别条目错误地导致数据面实例显示“建议升级”,即使控制面和数据面版本一致。
数据面
- 修复问题:批处理器在 nginx worker 关闭期间进入无限定时器循环,阻止优雅关闭并产生大量
[alert]日志。 - 修复问题:批处理器的
processed_entries计数器在过期缓冲区清理时被重置,导致批处理插件(如 http-logger、kafka-logger)的投递指标不准确。 - 修复问题:活跃健康检查的
request_body配置被静默忽略,因为底层健康检查库期望字段名为http_req_body。schema 字段已重命名以匹配。 - 修复问题:加密/解密操作失败时,错误日志中暴露敏感字段值。错误消息不再包含原始值。
- 修复问题:升级过程中新增
encrypt_fields后,预存明文数据的预期解密失败产生噪声的 warn 级别日志。这些日志现在记录为 info 级别并附带解释说明。
3.9.10
发布日期:2026-04-22
不兼容变更
插件
-
升级说明
OpenAPI2MCP 服务不再内置于网关镜像中,现作为独立 sidecar 容器(
api7/openapi-to-mcp)运行,网关镜像体积因此减少约 150 MB。如果你使用了openapi-to-mcp或mcp-tools-acl插件,需要在网关旁部署 OpenAPI2MCP sidecar 容器。Kubernetes 环境中,在网关 Helm chart 中启用openapiToMcp.enabled=true。Docker Compose 环境中,将api7/openapi-to-mcp容器与网关置于同一网络命名空间下。
升级须知
本版本为多个插件新增了 encrypt_fields:AI Proxy(auth.header、auth.query、auth.gcp.service_account_json)、AI Proxy Multi(instances.* 下的相同字段)、AI RAG(embeddings_provider.azure_openai.api_key、vector_search_provider.azure_ai_search.api_key)、AWS Lambda(authorization.apikey、authorization.iam.accesskey、authorization.iam.secretkey)、OpenID Connect(新增 client_rsa_private_key)和 SAML Auth(新增 secret_fallbacks)。
控制面升级到 3.9.10 后,在写入路由/服务配置到 etcd 时会加密这些新声明的字段。如果数据面仍运行旧版本(3.9.9 或更早),由于旧版不识别这些新的 encrypt_fields,将跳过解密,导致加密后的密文被原样使用——例如,AI Proxy 路由会将 AES 密文而非真实 API Key 发送给 LLM 提供商,导致静默的认证失败(LLM 返回 HTTP 401)。
推荐升级路径:按照标准升级顺序——先升级控制面,再升级数据面。但在升级控制面后,请勿修改上述受影响插件的配置,直到所有数据面都升级到 3.9.10。对这些插件的任何配置编辑或重新发布都会导致控制面加密新声明的字段,而旧版数据面无法解密。请在控制面升级后尽快将数据面升级到 3.9.10,以恢复完整的加解密一致性。
新功能
插件
- AI Proxy
- 新增
override.request_body支持按协议深度合并请求体覆盖,以及override.llm_options提供感知提供商的max_tokens映射。运维人员可通过request_body_force_override标志将协议特定参数(如max_tokens、stop_sequences)设置为默认值或强制值。优先级顺序:model options → LLM options(始终强制)→ request body(按协议深度合并)。 - 新增
max_stream_duration_ms和max_response_bytes安全限制,防止无界限的 LLM 流式响应导致 worker 进程 CPU 占用过高。超出任一限制时,流将被优雅终止并返回相应错误信号。 - 网关现在可在流式传输过程中检测客户端断开连接,并立即停止从 LLM 上游读取数据,释放 worker 资源并避免不必要的 API 配额消耗。
- 新增
- Prometheus、OpenTelemetry、Zipkin
- 新增
response_source标签(Prometheus)和apisix.response_sourcespan 属性(OpenTelemetry、Zipkin),用于分类每个响应的来源:"apisix"(由 APISIX 生成,如插件拒绝或路由未找到)、"nginx"(NGINX 代理错误,如连接被拒绝或上游超时)或"upstream"(来自上游服务的真实响应)。这使得在监控面板和告警中可以更精确地归因错误来源。
- 新增
控制面
- 新增 Consul 服务发现支持。网关现在可以发现注册在 Consul 中的上游服务,支持基于元数据的过滤和健康检查感知的节点选择。
- 控制面 现在可通过心跳动态推送遥测配置(如追踪采样率和导出端点)至数据面,无需重启网关。
- SSL/SNI 配置新增
skip_mtls_uri_regex字段,允许指定的 URI 模式跳过 mTLS 客户端证书校验,同时对其他所有 URI 保持 mTLS 强制校验。 - 新增
POST /apisix/admin/configs/validate批量配置校验接口。运维人员可在应用配置前校验路由、服务、上游和插件配置,在不影响线上流量的情况下捕获 schema 错误。 - DP Manager 现在在 7943 端口通过 cmux 支持原生 gRPC etcd 协议,为数据面在现有 HTTP etcd 协议基础上提供额外的连接选项。
encrypt_fields机制现在支持嵌套和复杂字段结构,包括任意深度的点分路径、数组和 map。包含深层嵌套敏感字段的插件配置(如auth.gcp.service_account_json)现在可以正确加密存储。
控制台(Dashboard)
- Key Auth 和 Basic Auth 插件新增表单模式配置,支持可视化凭证设置,无需手动编辑 JSON。
- 新增 OpenID Connect 快速启动预设模板,为常见身份提供商提供预填充的配置模板,简化 OIDC 插件初始配置。
- 上游配置界面新增 Consul 作为可选的服务发现类型。
- SSL/SNI 配置界面支持配置
skip_mtls_uri_regex,允许指定 URI 模式跳过 mTLS 客户端证书校验。