代理 Gemini 请求

Google Gemini 提供了一个 OpenAI 兼容的 API，允许你使用熟悉的 OpenAI API 格式访问 Gemini 模型。

本指南展示了如何使用 ai-proxy 插件将 APISIX 与 Google Gemini 集成。将 provider 设置为 gemini 后，你无需设置自定义端点。

前置条件

安装 Docker。
安装 cURL 以向服务发送请求进行验证。
按照快速入门教程在 Docker 或 Kubernetes 中启动一个新的 APISIX 实例。

获取 Google API 密钥

按照 Google AI Studio 创建帐户和 API 密钥。你可以选择将密钥保存到环境变量：

export GEMINI_API_KEY=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx  # 替换为你的 API 密钥

创建到 Gemini 的路由

创建一个带有 ai-proxy 插件的路由，如下所示：

Admin API
ADC
Ingress Controller

curl "http://127.0.0.1:9180/apisix/admin/routes" -X PUT -d '{
  "id": "gemini-chat",
  "uri": "/anything",
  "plugins": {
    "ai-proxy": {
      "provider": "gemini",
      "auth": {
        "header": {
          "Authorization": "Bearer '"$GEMINI_API_KEY"'"
        }
      },
      "options": {
        "model": "gemini-2.5-flash"
      }
    }
  }
}'

❶ 将提供商设置为 gemini。

❷ 使用 Authorization 标头附加 Google API 密钥。

❸ 设置 Gemini 支持的模型，例如 gemini-2.5-flash。

adc.yaml
services:
  - name: Gemini Service
    routes:
      - uris:
          - /anything
        name: gemini-chat
        plugins:
          ai-proxy:
            provider: gemini
            auth:
              header:
                Authorization: "Bearer xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
            options:
              model: gemini-2.5-flash

❶ 将提供商设置为 gemini。

❷ 使用 Authorization 标头附加 Google API 密钥。

❸ 设置 Gemini 支持的模型，例如 gemini-2.5-flash。

将配置同步到 APISIX：

adc sync -f adc.yaml

创建一个 Kubernetes 清单文件以配置路由：

Gateway API
APISIX CRD

gemini-route.yaml
apiVersion: apisix.apache.org/v1alpha1
kind: PluginConfig
metadata:
  namespace: ingress-apisix
  name: ai-proxy-plugin-config
spec:
  plugins:
    - name: ai-proxy
      config:
        provider: gemini
        auth:
          header:
            Authorization: "Bearer xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
        options:
          model: gemini-2.5-flash
---
apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
  namespace: ingress-apisix
  name: gemini-chat
spec:
  parentRefs:
  - name: apisix
  rules:
  - matches:
    - path:
        type: Exact
        value: /anything
    filters:
    - type: ExtensionRef
      extensionRef:
        group: apisix.apache.org
        kind: PluginConfig
        name: ai-proxy-plugin-config

gemini-route.yaml
apiVersion: apisix.apache.org/v2
kind: ApisixRoute
metadata:
  namespace: ingress-apisix
  name: gemini-route
spec:
  ingressClassName: apisix
  http:
    - name: gemini-route
      match:
        paths:
          - /anything
      plugins:
      - name: ai-proxy
        enable: true
        config:
          provider: gemini
          auth:
            header:
              Authorization: "Bearer xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
          options:
            model: gemini-2.5-flash

❶ 将提供商设置为 gemini。

❷ 使用 Authorization 标头附加 Google API 密钥。

❸ 设置 Gemini 支持的模型，例如 gemini-2.5-flash。

将配置应用到你的集群：

kubectl apply -f gemini-route.yaml

验证

向路由发送带有以下提示的请求：

curl "http://127.0.0.1:9080/anything" -X POST \
  -H "Content-Type: application/json" \
  -d '{
    "messages": [
      { "role": "system", "content": "You are a helpful AI assistant" },
      { "role": "user", "content": "What is the capital of France?" }
    ]
  }'

你应该收到类似以下的响应：

{
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "The capital of France is **Paris**.",
        "role": "assistant"
      }
    }
  ],
  "model": "gemini-2.5-flash",
  "object": "chat.completion",
  "usage": {
    "completion_tokens": 8,
    "prompt_tokens": 15,
    "total_tokens": 41
  },
  ...
}

下一步

你现在已经学会了如何将 APISIX 与 Google Gemini 集成。请参阅 Google AI for Developers 和模型页面以了解更多详细信息。

如果你想流式传输响应，请在请求中启用流式传输，并使用 proxy-buffering 插件来禁用 NGINX 的 proxy_buffering 指令，以避免缓冲服务器发送事件 (SSE)。

前置条件​

获取 Google API 密钥​

创建到 Gemini 的路由​

验证​

下一步​

前置条件

获取 Google API 密钥

创建到 Gemini 的路由

验证

下一步