プログラムをチョイ修正

1月4日、calcRewardで比較する価格を「前日の始値」から「前日の終値」に変更する。

この変更により、今までは「前日の始値」と「今日の終値」だったものが、「前日の終値」と「今日の終値」の比を基準として報酬を計算することになる。変更した理由は、単純に論文に書くときに理由が書きやすいからである。前日と今日で同じ値を比較しないとおかしいよね。「前日の”始値”」としていたことに何らかの根拠があったわけではないので変更します。ただ、もし学習が以前より適切に行われなくなった場合には元に戻すことにする。