ノーマルビュー

Received — 2026年1月29日 @IT 全フォーラム 最新記事一覧

推論コストを10分の1に? NVIDIAが次世代AIプラットフォーム「Rubin」発表

NVIDIAは、次世代AIコンピューティングプラットフォーム「Rubin」を発表した。前世代のBlackwellと比較して推論トークンの生成コストを最大10分の1に削減し、大規模モデルのトレーニングに必要なGPU数を4分の1に抑えるという。

TSR、協調型、プリエンプティブ、いろいろあった~マルチタスクの変遷を学ぶ

PCで複数のアプリケーションを同時利用することは当たり前になった。PowerPointやWordで資料を作りながら、Webブラウザで検索し、作業合間でチャットに応答しても驚く人はいないだろう。しかし、ここに至るまでにはさまざまな課題があった。今回は、複数のアプリケーションを同時に実行すること、つまり「マルチタスク」の話である。

MCPサーバの機能と実装の肝――仕組みと構築の流れをSpring AIで理解する

Java×Spring AIで始めるAIプログラミングの入門連載。前回はLLMを通じて外部ツールの実行が可能なTool Callingとその外部実行ツール自体を独立させて実装が可能なMCPという仕組みの流れについて説明しました。今回は、MCPサーバ自体の機能とSpring AIでMCPサーバを実装する流れについて解説します。
❌