2

外国為替市場からのライブ価格データの複数のソースを消費し、その出力として時系列データの 2 つのストリームを生成するプロセスがあります。出力はノイズが多く (つまり、sin や cos のように滑らかではありません)、両方のストリームが 0 と 100 の値の間にバインドされています。

機械学習または AI に、1 つのシグナルが急激にポジティブで、もう 1 つのシグナルが急激にネガティブであることを特定するのに役立つアプローチはありますか? 単純な移動平均線と指数移動平均線をいじって線を少し滑らかにしましたが、その方法ではあまりにも多くの情報を失います。

4

4 に答える 4

0

超賢明な機械学習を適用できます。

機能:最後のn個のデータポイントの値。ラベル:-1減少+1増加

これで、いくつかのラベル付きサンプルのみが必要になります。これにより、次のようなテーブルが作成されます(ここではn = 5)。

# t-4, t-3, t-2, t-1, t, label
#-----------------------------
54, 43, 98, 1, 45, +1
21, 12,  5, 98, 4, +1
 6, 78, 45, 65, 37 -1
...

次に、すぐに使用できる機械学習ライブラリ(WEKAなど)を使用して、これについて分類子をトレーニングします。アルゴリズムによっては、結果の確実性の測定値も取得します。必要なラベル付きトレーニングサンプルの数を予測することは困難です。最初は100を試してください。ただし、1000を超える可能性もあります。機能には多くの可能性もあります。絶対値ではなく差を使用すると、より適切に機能する可能性があります。

ラベル付けされたトレーニングデータは、手動でラベル付けできます。しかし、市場予測の場合、履歴データに基づいてこれを自動的に行うことがしばしば可能です。

在庫予測についてはたくさんの文献があるはずです。人々はこの分野で何年もの間研究を続けてきました(そして今もそうです)。上記はもちろん非常に原始的です。


もう1つのアプローチは、データをカーブに適合させ、その導関数を取得することです。データについてよく知っているほど、このアプローチは強力になります。たとえば、ノイズを生成する確率モデルについての良いアイデアがある場合は、「最適な」適合(最大可能性など)を導き出すことができます。基礎となる信号(測定しようとしている信号)について何か知っている場合は、これも役立ちます(線形?二次?、libschiz cont。?。有界?、...)。

このアプローチには、利用できない可能性のある問題固有の知識と、かなりの数学が必要です。しかし、機械学習のようにブラックボックスになってしまうのではなく、理解して分析できる材料モデルを使用することになるので、非常にやりがいがあります。

于 2010-08-15T15:18:12.617 に答える
0

Lawnmower の提案は良さそうに聞こえますが、考慮すべき追加の点がいくつかあります。

  • まず、質問を理解している限り、2 つ以上のラベルが考えられます。

    • 信号 1 アップ; シグナル2ダウン
    • 信号 2 アップ; シグナル 1 ダウン
  • 第二に、データを手動でマークするのは非常に面倒です。モデルのトレーニング、テスト、検証にはおそらく大量のデータが必要になるからです。Mechanical turkがこの作業をお手伝いします

  • 芝刈り機のアドバイスを聞いても、トレーニングの前にデータを少し滑らかにします

  • すべての入力変数を別の変数および出力に対してプロットして、変数が結果にどのように影響するかを把握します。ペアワイズ プロットが実際に不可能な場合は、PCA または別の次元削減手法を試してください

于 2010-08-17T06:27:55.753 に答える
0

生データで、一方が急に正で、もう一方が急に負である時期を判断するのはどうですか。次に、結果がその状態で十分長く持続するか、またはいくつかの短い期間の十分な割合で持続する場合にのみ、結果に重要なフラグを立てます。

于 2010-10-08T14:58:53.587 に答える