Vercel AI Gateway の API キー初期セットアップ手順 — Spend Quota と Auto-reload で「AI 破産」を防ぐ
Vercel AI Gateway を使い始めるときに、最初に手を入れることになるのが API キーの発行と Auto-reload、Spend Quota の設定です。とくに何も考えずにデフォルトで進めると、想定外のトラフィックや暴走したエージェントによる無限ループで、思っていた何倍もの API 費用が発生するリスクがあります。いわゆる「AI 破産」というやつです。
この記事では、最初に押さえておきたいミニマムな設定値だけを書き残します。詳細は Vercel AI Gateway の公式ドキュメント を読みながら適宜深掘りしてください。
Auto-reload は最初 OFF にして、コスト感覚を掴む
Auto-reload は、AI Gateway の残高が一定額を下回ると、自動で指定額まで補充してくれる機能です。本番運用ではほぼ必須になる便利な機能ですが、使い始めの段階では一度 OFF にしておく ほうが安心です。
理由はシンプルで、「何をすると、どれぐらいの API 費用がかかるのか」をまず体で覚えるためです。最初から Auto-reload を ON にしてしまうと、無自覚にトークンを使い込んでも残高が勝手に回復してしまい、コスト感覚が育ちません。逆に手動チャージにしておくと、「先週入れた残高、もう尽きたのか」というシグナルが直接届くので、何が高くついているのか把握しやすくなります。
設定例としては、以下のあたりが最小構成です。
- Auto-reload: OFF(最初の数週間〜数か月)
- When Balance Falls Below: 5 USD(後で Auto-reload を ON にするときの目安)
- Recharge To Target Balance: 25 USD(同上)
- Maximum Monthly Spend: 50 USD(万一 Auto-reload を ON にしたあとの月次上限)
慣れてきたら Auto-reload を ON にし、「月次の Maximum Monthly Spend」で青天井を止めるという二段構えに移行するイメージです。Maximum Monthly Spend は、後述する API キー側の Spend Quota とは別の、アカウント全体の予算上限として効きます。
API キーは production、preview、development の 3 本発行する
API キーは 1 本だけ発行して全環境で使い回す、はやめておきます。
Vercel は標準で production、preview、development の 3 つの環境を持っています(Vercel Environments のドキュメント 参照)。AI Gateway の API キーもこれに揃えて、
your-app-productionyour-app-previewyour-app-development
の 3 本に分けて発行するのが基本構成です。こうしておくと、「preview 環境のエージェントが暴走して大量に API を叩いた」みたいな事故が起きても、production の API キーには傷が付きません。後述する Spend Quota も環境ごとに別々に設定できるので、preview だけ予算を絞る、development はもっと絞る、といった運用がしやすくなります。
キーをローテーションするときも同様で、production だけ先に rotate するか、preview だけ先に試す、といった段階的な運用が可能になります。
Vercel env に登録するときは production / preview を必ず Sensitive にする
発行した API キーを Vercel の環境変数 に登録するときの注意点です。
production環境向けキー → Sensitive で登録preview環境向けキー → Sensitive で登録development環境向けキー → Vercel では development 環境の変数を Sensitive にできない仕様なので、Sensitive 指定そのものが不要(ローカルでの守り方は後述)
Vercel の Sensitive 環境変数は、一度登録すると Vercel のダッシュボード上から平文を読み出すことができなくなるフラグです(Sensitive Environment Variables 参照)。プロジェクトに後から Join したメンバーが画面上から値を覗けない、という前提を作れるので、本番系のクレデンシャルはこれをデフォルトと考えてよいです。
逆に Sensitive にしないと、ダッシュボードに権限を持つ全員から値が見える状態になります。AI Gateway の API キーは、漏れた瞬間に外部から API を叩き放題になるクレデンシャルなので、production / preview に関しては Sensitive 一択です。
development キーは Sensitive にできない分、ローカルでの保護が要になります。vercel env pull で取り出すと既定では .env.local に書き出されるので、取り出した直後に gitignore の状態を必ず確認してください。
Spend Quota は有効化し、Daily 設定で AI 破産を防ぐ
API キーごとに設定できる Spend Quota は、ほぼ無条件で ON にして使う べき機能です。Auto-reload がアカウント全体の蛇口を絞る仕組みだとすると、Spend Quota は API キーごとに二段目の絞りを入れる仕組みです。
設定の組み合わせ例は以下のとおりです。
- Spend Quota: ON
- Spend Quota ($): 100(production の例。preview / development はもっと下げる)
- Quota Refresh: Daily
ここで重要なのは、Quota Refresh を Daily にしておく ことです。Weekly や Monthly にすると、暴走したエージェントが 1 度に予算枠を食い尽くしたときに、復旧まで丸 1 週間〜1 か月待つことになります。一方、Daily にしておけば、最悪その日 1 日分の Quota を食い潰すだけで翌日に枠が戻ります。「事故ったらその日の枠を諦めて、翌日から復旧」という運用にできるのが、Daily 設定の最大の利点です。
環境ごとの予算の目安はプロジェクト規模によりますが、はじめは以下のような階段状の配分から始めるとイメージしやすいです。
| 環境 | 想定用途 | Spend Quota ($) の目安 |
|---|---|---|
| production | 本番ユーザー向けトラフィック | プロダクトの想定 DAU から逆算した上限 |
| preview | PR 単位のデプロイ、QA | production の 1/5〜1/10 |
| development | ローカル開発、エージェントの実験 | preview のさらに 1/5〜1/10 |
development の Quota が一番小さくなるのは直感に反するかもしれませんが、エージェントを書き間違えた無限ループは、ほぼ間違いなくローカル開発中に踏みます。production よりむしろ厳しく絞ったほうが安全です。
まとめ — まずは「壊れたときに壊れ方が分かる」状態を作る
ここまでの設定をまとめると、最初の構成はこうなります。
- Auto-reload は OFF にして、手動チャージで API 費用の感覚を掴む
- API キーは production / preview / development の 3 本に分ける
- Vercel env では production / preview のキーを必ず Sensitive にする
- Spend Quota は有効化し、Quota Refresh は Daily に固定する
- 環境ごとに予算階段を組み、development を一番厳しく絞る
AI Gateway は API ひとつで多数のモデルプロバイダにアクセスできる便利な抽象化(Vercel AI Gateway の概要 参照)ですが、その便利さは「コスト最適化された推論をワンクリックで世界中に投げられる便利さ」と表裏一体です。コスト感覚が育つ前にフル装備で運用を始めると、暴走時の被害が一気に伸びます。
最初の数週間は、Auto-reload OFF + Spend Quota Daily の組み合わせで、「壊れたとき、その日のうちに気づける」状態 を作ることを優先する。それぐらいの慎重さでちょうどよい、というのが今回の整理です。
残りのモデル選定やレート制限、Observability まわりは、Vercel AI Gateway の公式ドキュメント を読みながら順番に組んでいくのがおすすめです。
以上、AI Gateway の API キーまわりを初期セットアップしている、現場からお送りしました。