2009-06-19から1日間の記事一覧
Wikipediaより。 機械学習の分野におけるモンテカルロ法とは強化学習の一種で、行動によって得られた報酬経験だけを頼りに状態価値、行動価値を推定する方法のことを指す。 モンテカルロ法は、強化学習の一種とみなせる。なるほど、言われてみればその通りだ…
Wikipediaより。 機械学習の分野におけるモンテカルロ法とは強化学習の一種で、行動によって得られた報酬経験だけを頼りに状態価値、行動価値を推定する方法のことを指す。 モンテカルロ法は、強化学習の一種とみなせる。なるほど、言われてみればその通りだ…