リーディングビュー

AHC015を強化学習(PPO)で解いてみた

はじめに こんにちは、育児の傍らkaggleやatcoderをちょこちょこやっている4etaです。AHC015(Candy Box)を、強化学習(PPO)で解いてみました。 アルゴリズムの一般論は私のほかの記事にお任せして、この記事は実際にAtCoderで強化学習したコードを提出するための知見に寄せて書きます。 他の記事たち: https://zenn.dev/4eta/articles/5e1b16fac71b08 https://zenn.dev/4eta/articles/a0e0d2fa3215ed https://zenn.dev/4eta/articles/959a785...

💾

  •  
❌