0

気温、風速、気圧、湿度などのローカル測定値を時系列の形で持っているとしましょう。それが世界から知っているすべてです。ときどき、竜巻が私のプローブを通過します。

竜巻は単なるランダムなものではないため、訓練された目が時系列で認識できるパターンがあります...温度、風速などのいくつかの変化は、予測できない変動とともに、何らかの形で相互に関連しています。

竜巻が私の検出器によって「見られた」期間に対応する時系列の間隔を認識するために、何らかの自動方法でそれを行いたいと思います。

それらを認識し、対応する「信頼係数」を与えるには、どの機械学習方法がより適切でしょうか。

竜巻は本質的に不安定な物体であり、さらに何らかの不規則な方法で移動するため、竜巻が検出器の上を前後に移動する可能性があるため、検出器は温度、風速などの同じ変化を常に見るとは限らないことに注意してください。その形状など。私が言いたいのは、時系列の測定値は、竜巻の「静止フレーム」にプロットできるこれらの量の実際の空間プロファイルに対応していないということです。ただし、それは常に、私の目だけで認識できるランダム性を備えた「一種の」同じ機能を表示し、ML に適したタスクであると考えさせます。

その他の質問: 推奨される方法を実装する Python ML ライブラリはありますか? (PyBrain、Scikit ? ...?)

4

2 に答える 2

1

機械学習アルゴリズムにはさまざまなものがあります。あなたが提供した情報は、さらに調査しない限り、アルゴリズムのいずれかのグループが優れていると示唆するものではありません。拡張された時系列は、削減された特徴ベクトルを作成するためのアルゴリズムが必要になる可能性があることを示唆しています。ニューラル ネットワークは、信頼係数を自動的に提供しません。数百のランダムな正例と負例のデータセットを公に配布する意思がある場合、多くの異なるグループが時間の経過とともにさまざまなアルゴリズムを適用する可能性があります。このプロセスを高速化するさまざまな「コンテスト」サイトが存在します。

于 2013-01-05T06:04:25.653 に答える
1

おそらく、データ上の移動ウィンドウでいくつかの時系列機能を抽出し、いくつかのイベントを竜巻発生のポジティブな例として手動でラベル付けし、残りのサンプルをネガティブとして扱い、分類器を適合させてランダ​​ムな天気からポジティブな竜巻イベントを区別することが可能ですセンサーから測定された状態。

あなたのデータには、そのようなイベントがいくつありますか? 予測精度の十分な推定で十分に信頼性の高いモデルをトレーニングできるようにするには、少なくとも 100 の竜巻イベントが必要だと考える場合。

http://figshare.comなどで、このデータセットを公に配布できますか?

于 2013-01-04T10:26:38.947 に答える