2007-12-09から1日間の記事一覧

RCIRoboをStateType=5で2回実験した

学習に用いた銘柄は以下の9銘柄 6501 7011 7912 8267 8601 8604 9432 9433 9437 途中でプログラムを多少変えてしまったので、全く同じ環境で2回の実験を行ったわけではない。なので、その点は気にかけつつ解析していく。 学習結果をグラフ(資産評価額)に…

新しい学習方式を実装する

今あるRobotクラスと異なること 学習を1ステップ後にすぐ行うのではなく、Nステップ後に行う 行動の評価基準 株価(またはそのN日間平均) 株式の含み益(評価できるのは行動がBUYであったときに限られる) 資産評価額 こんな感じだろうか

今日の深夜実験

学習率αの値を0.1、0.3、0.6、0.9、0.01で実験させて寝る