RCIRoboをStateType=5で２回実験した

カブロボ

学習に用いた銘柄は以下の９銘柄 6501 7011 7912 8267 8601 8604 9432 9433 9437 途中でプログラムを多少変えてしまったので、全く同じ環境で２回の実験を行ったわけではない。なので、その点は気にかけつつ解析していく。学習結果をグラフ（資産評価額）に…

新しい学習方式を実装する

カブロボ

今あるRobotクラスと異なること学習を1ステップ後にすぐ行うのではなく、Nステップ後に行う行動の評価基準株価（またはそのN日間平均）株式の含み益（評価できるのは行動がBUYであったときに限られる）資産評価額こんな感じだろうか

カブロボ

学習率αの値を0.1、0.3、0.6、0.9、0.01で実験させて寝る