ノーマルビュー

昨日 — 2026年4月16日 Qiita - 人気の記事

Gemini Flex推論の503率を1週間実測し、fallback付きで本番導入してコスト49%削減した話

著者: ntaka329
2026年4月15日 15:45
はじめに GMOコネクトの永田です。 2026年4月、Gemini APIに「Flex」「Priority」という新しい推論階層が追加されました。Flexは標準料金の50%オフ。ただし「503が返るかもしれない」ベストエフォート型です。 半額は魅力的ですが、公式ドキュメン...
Received — 2026年4月2日 Qiita - 人気の記事

月300件の業務ログからQiita記事ネタを自動発掘する — Gemini APIのThinking Level使い分けと差分キャッシュ設計

著者: ntaka329
2026年4月2日 11:46
はじめに — 課題と動機 GMOコネクトの永田です。 チームでAIツールを業務に使っていると、実は記事になりそうなナレッジが日々のログに埋まっています。ただ、本人は「ただの作業メモ」だと思っていて、記事ネタだと気づいていないことがほとんどです。 また、数十名のメンバーが月...
❌