ノーマルビュー

昨日 — 2026年4月16日 Qiita - 人気の記事

Gemini Flex推論の503率を1週間実測し、fallback付きで本番導入してコスト49%削減した話

著者: ntaka329
2026年4月15日 15:45
はじめに GMOコネクトの永田です。 2026年4月、Gemini APIに「Flex」「Priority」という新しい推論階層が追加されました。Flexは標準料金の50%オフ。ただし「503が返るかもしれない」ベストエフォート型です。 半額は魅力的ですが、公式ドキュメン...
❌