❌

ノーマルビュー

今日 — 2026年1月18日 ⏭ ポータル

生成AIの収束先の存在を圏論で証明する

2026年1月17日 18:19

はじめに敵対的模倣学習の圏論的解釈について紹介します。近年、敵対的模倣学習 (Generative Adversarial Imitation Learning; GAIL) や、それを応用した RLHF (Reinforcement Learning from Hu...