そもそも、LSTMとは何か。第1章 LSTM完全解説(第1章:基礎と仕組み)
こんばんは。OQカスタマースタッフです。ディベロッパーの方より、大型アップデートもリリースされましたので、今回は私と一緒に、LSTMについめ、少しお勉強しましょう。
所で皆様LSTMのお話に入る前にトレードをしていて、誰しもが一度は「未来が見えたらいいな。」そう思った事はないでしょうか。
私も実はその一人でございます。
統計学、確率において、確率が高いほど未来の事象を的中させる事が可能な事は皆様もお分かりかと。
例えば、紙に火をつける。すると、その数分後紙はどうなると、予測しますか。
燃える確率が、99.9%ですよね。100%という数字を評価しないのは、世界というのは不確定要素で成り立っていると、私達は考えています。
例えば、火をつけた次の瞬間、世界が数秒真空になるかもしれないですよね。なので、100%紙が燃えるとは限らない。
そう。なので、未来の事は誰にも分かりません。
ですが、話を戻して、確率が高ければ、高いほど未来の事象を予測しやすい。
実はこれ「人間もAIも同じ」なんです。ただ、皆さん知っての通り人間とAIが違うのは予測に一切メンタル的バイアスを持ち要らない事です。
では、AIはどうやって、未来を予測するのでしょうか。
お待たせしました。本題です。
AIが未来を予測する為に使用する機械学習のモデルを「LSTM」と呼びます。
まず、LSTM(Long Short-Term Memory)は、
時系列データを扱うために設計された特殊なニューラルネットワークです。
時系列データというのは簡単に言うと、
・FXや株式などのテクニカルチャートです。
通常のニューラルネットワーク(全結合層)は「単発の入力」に強いが、
以下のような「時間の流れ」があるデータには弱いという特徴があります。
- 為替(XAUUSDなど)
- 株価
- 音声
- テキスト(文章)
- センサー時系列
だからこそ、ここで役に立つのがRNN(再帰型ニューラルネットワーク)
RNN 再帰型ニューラルネットワークは、
RNNは「過去の情報」を引き継ぎながら計算します。
x(t-2) → h(t-2)
↓
x(t-1) → h(t-1)
↓
x(t) → h(t)
↑計算式で言えばこういう計算式を使います。
簡易に説明すると、「元の状態に戻りながら、記憶していく。だから、FXなどの時系列データ学習に強い。」
通常のニューラルネットワーク
入力->出力を繰り返して学習。
リカレントニューラルネットワーク
入力->過去の記憶->出力
↑なので、FXや株式投資のチャートパターンを学習して、未来のチャートを予測するのに長けている。
しかし、ここで、致命的な問題があります。
RNN(再帰型ニューラルネットワーク)は、
勾配消失(Vanishing Gradient)
時間が長くなると…
過去の情報がどんどん消えるという、決定的問題がありました。
つまり、ローソク足100本学習してしまうと、学習した事が0になってしまいます。
まるで、3は歩いたら全部忘れる猫ですね。
これでは、何の役にも立たない。
そこで、この問題を解決したのが冒頭に述べた「LSTM」
簡単にいうと、RNNとLSTMの決定的な違いは、「何を忘れて何を覚えるな。」て、事が可能になったんです。
つまり、より人間の脳に近くなったという事です。
余談ではありますが、
脳医学の分野でいうと、人間の記憶というのは、実は今まで記憶した事は全て覚えています。忘れる、思い出せないという事象は要はタンスが引っかかって引き出せないのと同じで記憶が出てこないだけみたいですよ。
話を戻しますが、AIはまだそこまで、人間に近くはなく、学習するに辺り、取捨選択をしながら、学んでいきます。
つまり、LSTMというのは、現代のニューラルネットワーク、機械学習、AI分野において、最新鋭の技術です。
では、これが、トレードにどう、活かせるか。
①パターンの連続性を学習する
②人間の感覚を数値化し評価し未来を推測可能にする
この2つかと存じます。
私の知人に彼此数十年トレードを専業で行なっているものがおりますが、「最期に辿り着いた解は、トレードは最期には全て値動きの癖で次の一手が分かるようになるよ。」と、仰られてました。
その方は10万時間以上チャートと向き合わられて来られたそうですが、その、10万時間という莫大な経験量を一瞬でAIに学習させるのがLSTMもといは機械学習です。
いい時代になりましたね。
さて、次回は、LSTMの決め手となる、TesolFlowについて、解説していきます。
それでは、また、次回会いましょう。
Is it OK?