データサイエンティスト(仮)

元素粒子論博士。今はデータサイエンティスト(仮)。

KerasでDeep Learning:LSTMで日経平均株価を予測してみる

導入

前回までで、画像データに関してDeep Learningを試してきました。画像データは、各データが独立と期待されるようなタイプのデータです。しかしながら、Deep Learningはこのような各データが独立であるような場合だけでしかできないというわけではありません。データ間に相関がある場合の代表例として、時系列データがあります。今回は、時系列データに対して威力を発揮するネットワークをKerasで実装してみます。

使用データ

人工データを使うのもあれなので、より現実的で身近なデータを使ってみます。今回は、日経平均株価終値(日次)を使います。日経平均株価のデータは、以下のサイトからダウンロードしました。
日経平均株価 1時間足 時系列データ CSVダウンロード
あるだけ(2007年以降)全てダウンロードし、それらを結合して一つのファイルを作っておきます。

終値(finish)をプロットすると、以下のようになっています。
f:id:tekenuko:20170725001823p:plain
今回は、このデータの90%を学習と検証に使用し、残り10%で予実比較をします。

参考

ネットワークの組み方は、以下を参考にしました。
qiita.com
ただし、こちらのKerasのVersionは古いので、いくつかオプション名が変わっています。そこはdocumentなどを参照して適宜書き換えます。

前処理

今回、予測の仕方を少しだけ工夫します。直前の50営業日の株価データを用いて、次の営業日の株価を予想する、という方法です。その用途に即したデータ加工を以下の関数で行います。

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

# 直前のn_prev 日分のデータと、その次の営業日のデータを生成
def _load_data(data, n_prev = 50):  
   
    docX, docY = [], []
    for i in range(len(data)-n_prev):
        docX.append(data.iloc[i:i+n_prev].as_matrix())
        docY.append(data.iloc[i+n_prev].as_matrix())
    alsX = np.array(docX)
    alsY = np.array(docY)

    return alsX, alsY
# 学習用とテスト用データを分割、ただし分割する際に_load_data()を適用
def train_test_split(df, test_size=0.1, n_prev = 50):  
    """
    This just splits data to training and testing parts
    """
    ntrn = round(len(df) * (1 - test_size))
    ntrn = int(ntrn)
    X_train, y_train = _load_data(df.iloc[0:ntrn], n_prev)
    X_test, y_test = _load_data(df.iloc[ntrn:], n_prev)

    return (X_train, y_train), (X_test, y_test)

train_test_split()にしかるべき株価データを投入すれば、所定の形式の学習・テストデータを生成することができます。株価データは、dfというDataFrameに格納されており、終値カラム名はfinishであるとします。スケールを狭めるのに、全体の平均値で割った操作をした終値を目的変数とします。

# 全体の平均値で割る
df['obs'] = df['finish'] / df['finish'].mean()
length_of_sequences = 50
(X_train, y_train), (X_test, y_test) = train_test_split(df[['obs']], test_size = 0.1, n_prev = length_of_sequences)

LSTM

ここでは、時系列データを扱うネットワークであるRecurrent Neural Network(RNN)の一つである、LSTMというネットワークを用いてモデル化します。LSTMに関する詳しい説明は、例えば以下の書籍やサイトなどを参照ください*1
bookclub.kodansha.co.jp
qiita.com

Kerasで必要なライブラリをインポートし、前回までと同じような感じでネットワークを組んでみます。

from keras.models import Sequential  
from keras.layers.core import Dense, Activation  
from keras.layers.recurrent import LSTM

in_out_neurons = 1
hidden_neurons = 100

model = Sequential()  
model.add(LSTM(hidden_neurons, batch_input_shape=(None, length_of_sequences, in_out_neurons), return_sequences=False))  
model.add(Dense(in_out_neurons))  
model.add(Activation("linear"))  

これは可視化すると以下のようなネットワークを組んだことになっています。
f:id:tekenuko:20170725003656p:plain
書籍などで勉強するとわかりますが、このLSTMというところは、中身は結構複雑です。

学習をさせてみます。

model.compile(loss="mean_squared_error", optimizer="adam")
history = model.fit(X_train, y_train, batch_size=600, epochs=50, validation_split=0.2)
Train on 1822 samples, validate on 456 samples
Epoch 1/50
1822/1822 [==============================] - 2s - loss: 0.5133 - val_loss: 0.4263
Epoch 2/50
1822/1822 [==============================] - 2s - loss: 0.0918 - val_loss: 0.0283
Epoch 3/50
1822/1822 [==============================] - 2s - loss: 0.0574 - val_loss: 0.0162
Epoch 4/50
1822/1822 [==============================] - 2s - loss: 0.0108 - val_loss: 0.0325
Epoch 5/50
1822/1822 [==============================] - 2s - loss: 0.0109 - val_loss: 0.0707
Epoch 6/50
1822/1822 [==============================] - 2s - loss: 0.0179 - val_loss: 0.0485
Epoch 7/50
1822/1822 [==============================] - 2s - loss: 0.0080 - val_loss: 0.0116
Epoch 8/50
1822/1822 [==============================] - 1s - loss: 0.0025 - val_loss: 0.0016
Epoch 9/50
1822/1822 [==============================] - ETA: 0s - loss: 0.006 - 2s - loss: 0.0065 - val_loss: 0.0016
Epoch 10/50
1822/1822 [==============================] - 2s - loss: 0.0043 - val_loss: 0.0070
Epoch 11/50
1822/1822 [==============================] - 2s - loss: 0.0020 - val_loss: 0.0177
Epoch 12/50
1822/1822 [==============================] - 2s - loss: 0.0032 - val_loss: 0.0188
Epoch 13/50
1822/1822 [==============================] - 2s - loss: 0.0028 - val_loss: 0.0108
Epoch 14/50
1822/1822 [==============================] - 2s - loss: 0.0018 - val_loss: 0.0049
Epoch 15/50
1822/1822 [==============================] - 2s - loss: 0.0019 - val_loss: 0.0039
Epoch 16/50
1822/1822 [==============================] - 2s - loss: 0.0018 - val_loss: 0.0056
Epoch 17/50
1822/1822 [==============================] - 2s - loss: 0.0015 - val_loss: 0.0075
Epoch 18/50
1822/1822 [==============================] - 2s - loss: 0.0015 - val_loss: 0.0072
Epoch 19/50
1822/1822 [==============================] - 2s - loss: 0.0014 - val_loss: 0.0057
Epoch 20/50
1822/1822 [==============================] - 2s - loss: 0.0013 - val_loss: 0.0045
Epoch 21/50
1822/1822 [==============================] - 1s - loss: 0.0012 - val_loss: 0.0041
Epoch 22/50
1822/1822 [==============================] - 2s - loss: 0.0012 - val_loss: 0.0039
Epoch 23/50
1822/1822 [==============================] - 2s - loss: 0.0011 - val_loss: 0.0037
Epoch 24/50
1822/1822 [==============================] - 2s - loss: 0.0010 - val_loss: 0.0036
Epoch 25/50
1822/1822 [==============================] - 2s - loss: 9.9451e-04 - val_loss: 0.0035
Epoch 26/50
1822/1822 [==============================] - 2s - loss: 9.4513e-04 - val_loss: 0.0028
Epoch 27/50
1822/1822 [==============================] - 2s - loss: 9.0099e-04 - val_loss: 0.0026
Epoch 28/50
1822/1822 [==============================] - 2s - loss: 8.5874e-04 - val_loss: 0.0023
Epoch 29/50
1822/1822 [==============================] - 1s - loss: 8.1982e-04 - val_loss: 0.0020
Epoch 30/50
1822/1822 [==============================] - 2s - loss: 7.9007e-04 - val_loss: 0.0018
Epoch 31/50
1822/1822 [==============================] - 2s - loss: 7.5337e-04 - val_loss: 0.0019
Epoch 32/50
1822/1822 [==============================] - 2s - loss: 7.1939e-04 - val_loss: 0.0019
Epoch 33/50
1822/1822 [==============================] - 2s - loss: 6.9869e-04 - val_loss: 0.0016
Epoch 34/50
1822/1822 [==============================] - 2s - loss: 6.7346e-04 - val_loss: 0.0013
Epoch 35/50
1822/1822 [==============================] - 2s - loss: 6.7397e-04 - val_loss: 0.0013
Epoch 36/50
1822/1822 [==============================] - 2s - loss: 6.4443e-04 - val_loss: 0.0013
Epoch 37/50
1822/1822 [==============================] - 2s - loss: 6.2074e-04 - val_loss: 0.0014
Epoch 38/50
1822/1822 [==============================] - 2s - loss: 6.3547e-04 - val_loss: 0.0014
Epoch 39/50
1822/1822 [==============================] - 2s - loss: 6.0775e-04 - val_loss: 0.0012
Epoch 40/50
1822/1822 [==============================] - 2s - loss: 6.3238e-04 - val_loss: 0.0012
Epoch 41/50
1822/1822 [==============================] - 2s - loss: 6.0300e-04 - val_loss: 0.0014
Epoch 42/50
1822/1822 [==============================] - 2s - loss: 6.1697e-04 - val_loss: 0.0012
Epoch 43/50
1822/1822 [==============================] - 2s - loss: 6.3159e-04 - val_loss: 0.0012
Epoch 44/50
1822/1822 [==============================] - 2s - loss: 6.1184e-04 - val_loss: 0.0013
Epoch 45/50
1822/1822 [==============================] - 2s - loss: 6.1628e-04 - val_loss: 0.0013
Epoch 46/50
1822/1822 [==============================] - 2s - loss: 5.9740e-04 - val_loss: 0.0012
Epoch 47/50
1822/1822 [==============================] - 2s - loss: 6.0511e-04 - val_loss: 0.0012
Epoch 48/50
1822/1822 [==============================] - 2s - loss: 6.0267e-04 - val_loss: 0.0014
Epoch 49/50
1822/1822 [==============================] - 2s - loss: 6.1846e-04 - val_loss: 0.0012
Epoch 50/50
1822/1822 [==============================] - 2s - loss: 6.0198e-04 - val_loss: 0.0012

途中少しぶれがあれど、train、validationともにepoch数が大きくなるにつれてlossが減少しています。

念のため可視化すると以下の感じになっています。
f:id:tekenuko:20170725004114p:plain

予測

いよいよ予実比較してみます。

# 予測値算出
predicted = model.predict(X_test) 
# 実績と比較
dataf =  pd.DataFrame(predicted)
dataf.columns = ["predict"]
dataf["input"] = y_test
dataf.plot(figsize=(15, 5))

可視化すると以下のようになっています。
f:id:tekenuko:20170725004300p:plain

うーん、見た目的には似てる感じですが、これをもって予測がうまくいっていると言えるのか…?色々試して考察しなきゃいけない事案な気がするので、いったんはコメントを控えておこう(笑)ここでのメッセージはKerasを使うとDeep Learningによる株価予測をお手軽にできるよ、ということで。

まとめ

今回は株価データに対してLSTMを適用してみました。今回はかなり単純なセットアップをとったので、まだまだやりようはありそうです*2。そういった試行錯誤は気が向いたらやります(笑)

次回以降はまた画像に戻って画像生成とか考えてみようかな、と妄想中です。

*1:説明を放棄してしまいました。まあ世の中にはたくさん解説があるので、あえてここで説明しなくてもよいかな、と思ったということで(笑)

*2:過去X日分のデータからY日間の平均を予測、翌日株価が上がったか下がっただけに着目、日経平均以外のデータを考慮などです。