数兆パラメータの時代に、無料GPU環境で3Bモデルを動かしたら想像以上だった
2026年2月20日 18:45
2026年に入っても、LLMの巨大化は加速し続けています。
GPT-5は推定数兆パラメータ(MoEアーキテクチャ、公式非公開)。Llama 4 Behemothは約2兆、Kimi K2.5は1兆。GLM-5 Reasoningがオープンソースランキング首位を取り、DeepSeek V3.2(671B)がMITライセンスで公開されるなど、大規模モデルの競争は激しさを増しています。
これらをローカルで動かすにはH100やH200が複数枚必要です。APIであれば月$20程度のサブスクリプションで利用できるサービスもありますが、トークン数や利用回数の制限があり、大量のリクエストを処理する場合は従...