2007-11-19から1日間の記事一覧

doubleの演算による「丸め誤差」を避けるためのテク

プログラム: public static void main(String[] args) { for (double i = -3; i <= 3; i += 0.10) { System.out.println(i); } } 実行結果: -3.0 -2.9 -2.8 -2.6999999999999997 -2.5999999999999996 -2.4999999999999996 ... 望んでいる結果: -3.0 -2.9 …

報酬の条件を資産評価額の増減によって判断させる

現在の報酬条件では、ある銘柄の購入価格(始値)と終値を比較し、実行した行動が「購入」、「売却」かによって変えている。 public double calcReward(double action, Stock stock, InformationManager im) { double reward = 0; //株の購入価格はその日の…

全然進まんな

いい改善案が思いつかなくて、サッパリ進まん

今週もがんばろう!

今日はとりあえず報酬をいじくってみる!

報酬がうまくいかない

シグモイド関数のような曲線を描く関数で、−1〜1までの値が得られるものはないかなと探していたらtanh関数が見つかったのでそれを利用したのだけれど、いつも同じ値が出てしまいまともに学習されない。 今日はもう遅いので、明日検証する。 public double …