2007-12-01から1ヶ月間の記事一覧

前の更新からだいぶたってしまった。

Timerを使う。周期的に実行したり、一定時間後に実行したり 上のページを参考に、今やっていることを一定時間ごとにユーザーに問い合わせて怠けるのを防止するプログラムを作ろうと思う。

行動を「買う」「売る」「待つ」の三つにしてみたけれど

成績がよくない。 action値が−0.5〜0.5っていうのが広すぎるのかも +−0.2にしてみる 追記 「買う」「売る」方式のほうが明らかに成績がいい…

研究で扱う銘柄リスト

参考は「テクニカル指標組合せルールの学習に基づく投資家意思決定支援」 ランダム取引で大きく利益が出た銘柄 6301,コマツ 8306,三菱UFJ 8591,オリックス 9984,ソフトバンク 8604,野村ホールディングス 2914,JT ランダム売買で利益が出た銘柄 7203,トヨタ自…

RCIRoboをStateType=5で2回実験した

学習に用いた銘柄は以下の9銘柄 6501 7011 7912 8267 8601 8604 9432 9433 9437 途中でプログラムを多少変えてしまったので、全く同じ環境で2回の実験を行ったわけではない。なので、その点は気にかけつつ解析していく。 学習結果をグラフ(資産評価額)に…

新しい学習方式を実装する

今あるRobotクラスと異なること 学習を1ステップ後にすぐ行うのではなく、Nステップ後に行う 行動の評価基準 株価(またはそのN日間平均) 株式の含み益(評価できるのは行動がBUYであったときに限られる) 資産評価額 こんな感じだろうか

今日の深夜実験

学習率αの値を0.1、0.3、0.6、0.9、0.01で実験させて寝る

まだまだ、基本的な売買部分にバグがある

たまーにぬるぽが出るのでそれを撲滅するだけの一日になりそうだな。 朝は家の共用パソコンを実験に使えないかと、使ってないメモリを足して増強したけど、役に立たちそうもない…。 バグの原因 現金余力もないのに注文を出す。 羅列しようと思ったけど、今日…

初めて知った。javaが0月と返すこと

そのままじゃだめで+1しないとだめなのか。知らんかった。

今後の課題

売買履歴の出力は出来るようになった 複数のテクニカル指標を用いた状態クラスの作成 実験を評価するにふさわしい、銘柄をみつける。50銘柄を種類わけする 株価が2004年から2006年末にかけて一本調子で株価が上げ続けていないものが望ましい ある特定の銘柄…

訂正、これぐらいきろくとっといてもいいかな

12月7日,売り,400株,株式評価額,保有株,資産評価額

結局昨日はやらずに寝た

今日は夕方まで空いてるので、がんばる。 売買履歴の出力形式は、 12/7,売り,400株 12/8,買い,200株という形式にしよう。csvで書き出せば、Excelでいじくれるしね。 追記 12月7日,売り,400株,株式評価額,保有株,資産評価額

強化学習に使う銘柄選び

2004年〜2007年にかけて株価が単純に上昇しているものは、BUY&HOLDで利益が出てしまうため、強化学習エージェントに学習させてもあまり意味がない。実験に用いる銘柄は、カブロボが扱う銘柄50の中から選び、株価がある一定の価格幅で上下しているものが望ま…

取引履歴を出力できるようにしよう。

出力された取引履歴と株価チャートを照らし合わせれば、いいところで株を買っているかどうかがわかるっていうこと。 よし、今日はこれを実装する。

ぬるぽの原因を探り、始末せよ!

HashMapとLinkedListに要素を追加している部分が怪しいので調べる ArrayList<Portfolio> portfolioList = pm.getPortfolio(); Portfolio portfolio = portfolioList.get(portfolioList.size() - 1); System.out.println("TradeID:" + portfolio.getTradeId() + " を" + </portfolio>…

あぁ、もう卒研の終わりも近づいていると言うのに致命的な欠陥を発見

メインプログラムの売買メソッドにバグを発見。 一度株を購入すると、その株を全て売り切るまで新規で購入していないことに今更ながら気づく。 プログラムを見てみると、なぜかif(株を持っていない)新規買い注文;というわけのわからんことになっていた。 i…

やること追加

あたらしい状態を作成する(複数のテクニカル指標を組み合わせたものなど)。 報酬の与え方を見直す。 通常、行動を行って次の状態に移行した段階で学習は行われるのを、5日後に変更する 自分の資産増加を基準にした報酬を使えるレベルにする

複数のテクニカル指標を組み合わせた状態を作成する

大学の研究室で実験を繰り返し自動実行しているので、終わったところまでの結果を回収する 新しい状態クラスを作る(今は移動平均乖離率とRSIのみ) 複数のテクニカル指標を組み合わせた状態を作成する 1は保留で2は先ほど完了、なので3を今から作成する…