12

説明

10 個のシーケンスを持つデータセット (シーケンスは 1 日の株価記録に対応します) を考えると、それぞれが朝または午前 9:05 から始まる 5 分間隔で区切られた 50 の株価のサンプル記録を構成します。ただし、トレーニング セットでのみ使用可能な 1 つの余分な記録 (51 番目のサンプル) があります。これは、50 のサンプル記録で最後に記録されたサンプルよりも 5 分ではなく 2 時間後です。この 51 番目のサンプルは、最初の 50 個のサンプルも与えられているテスト セットに対して予測する必要があります。

pybrainこの問題には、シーケンスをグループ化する再帰型ニューラル ネットワークを使用していますy。各サンプルのラベル (または一般に target として知られている) はx_i、次のタイム ステップのサンプルです。これx_(i+1)は、時系列予測の典型的な定式化です。

A sequence for one day is something like:

    Signal id    Time      value
        1     -  9:05   -   23
        2     -  9:10   -   31
        3     -  9:15   -   24
       ...    -  ...    -   ...
       50     -  13:15  -   15

Below is the 2 hour later label 'target' given for the training set 
and is required to be predicted for the testing set
       51     -  15:15   -   11

質問

再帰型ニューラル ネットワーク (RNN) がこれらの 10 個のシーケンスでトレーニングした後、別のシーケンスに直面した場合、 を使用してシーケンスの最後のサンプルの後のRNN株価を予測するにはどうすればよいでしょうか?2 hours

トレーニング シーケンスごとに「最後のサンプル在庫値より 2 時間後」もあることに注意してください。ただし、RNNサンプル間の時間間隔が同じであることを想定しているため、それをトレーニングに組み込む方法がわかりません。ありがとう!

4

1 に答える 1

23

これがあなたを助けることを願っています

リカレントネットワーク構造

ここに画像の説明を入力


いくつかのヒント

リカレント ネットワークの選択

より成熟した Long Short Time Memory (LSTM) ニューラル ネットワークは、この種のタスクに最適です。LSTM は、株価の「グラフ」で一般的な「形状」と「変化」を検出することができ、そのような形状が実際に実際に発生することを証明しようとする多くの研究があります! 例については、このリンクを参照してください

正確さ

ネットワークでより高い精度を実現したい場合は、入力数が 50 から 100 に倍増するように、ネットワークに前年 (まったく同じ日付) の株価もフィードすることをお勧めします。データセットで十分に最適化されているため、将来の予測不可能な動作を予測することはできません;)

于 2013-09-09T06:24:35.627 に答える