AHC015を強化学習(PPO)で解いてみた
2026年4月19日 11:47
はじめに
こんにちは、育児の傍らkaggleやatcoderをちょこちょこやっている4etaです。AHC015(Candy Box)を、強化学習(PPO)で解いてみました。
アルゴリズムの一般論は私のほかの記事にお任せして、この記事は実際にAtCoderで強化学習したコードを提出するための知見に寄せて書きます。
他の記事たち:
https://zenn.dev/4eta/articles/5e1b16fac71b08
https://zenn.dev/4eta/articles/a0e0d2fa3215ed
https://zenn.dev/4eta/articles/959a785...