高見知英のかいはつにっし(β)

高見知英のアプリケーション開発日誌 のほか、地域活動などの活動報告ブログ。

重点サンプリングを用いたGAによる強化学習 1章

 さて、まずはGAというものからしてよく分からないですが、名の通り従来のアルゴリズム という意味でしょうか。従来のアルゴリズムというのは、にあるように、遺伝的アルゴリズムやら何やらを全部ひっくるめた言葉として考えると良さそう(うわ、乱暴…)、まあ、"既存のもの"という風に考えれば安全かな。

 この論文では、記憶すべき事象一つ一つに重み付けをして、引っ張られやすい記憶とそうでない記憶を用意する。そしてその方法を提案するということで考えるといいのかも。って、なんか表題そのままですね(^_^;)
まあ、人間の思考システムという意味で考えても、その辺は当たり前の話かも。

 プログラムで表現する場合、記憶一つ一つをモジュールとして、オブジェクト的な動作が行えるようにするといいかもしれませんね。で、全部に参照回数をつけて必要なときに並び替えていくと。記憶方法を丸ごとオブジェクト指向的なもので再現してみるのも、面白いかもしれません(もちろん、継承の概念なども全部ありとして)、そうすればひらめきとか、発想転換とかを再現できるし。