適格度トレースは難しい

適格度トレースは良くわからんので、つま先でつついてはみるけど踏み込まないのが続いていました。がしかし、こんな感じに学習させたらいいんじゃない?と考えていたことが、適格度トレースに似ているようなのでちょっと真面目に読んでみました。
http://www.ntt.dis.titech.ac.jp/~yamamoto/RL7.pdf
上の文書はRichard S. SuttonのReinforcement Learning(邦題は強化学習)の7章適格度トレースのまとめです。本書自体(翻訳版ですが)はあるんですけど、イマイチ読む気になれなかったので、こういうのはありがたいです。本文を読む気にさせてくれます。

で、結局適格度トレースはどうよ

正直よく理解できていないって言うのもあるんだろうけど、適格度トレースは株式のアルゴリズム取引に適しているかなーというと微妙かなと。それよりも、より多くの実際の株式データを使って学習させたほうがよさそうです。