Gemini Flex推論の503率を1週間実測し、fallback付きで本番導入してコスト49%削減した話 Qiita - 人気の記事 著者: ntaka329 2026年4月15日 15:45 はじめに GMOコネクトの永田です。 2026年4月、Gemini APIに「Flex」「Priority」という新しい推論階層が追加されました。Flexは標準料金の50%オフ。ただし「503が返るかもしれない」ベストエフォート型です。 半額は魅力的ですが、公式ドキュメン...