2

train()データのカスタムトレイン/テストパーティションで実行する方法はありますか?時系列データのバックテストに興味があります(従来のリサンプリング/ CVなどが不適切/リークの場合)。つまり、データが1 ... Nから時間どおりに順序付けられている場合、特定のカットオフの前にデータを繰り返しトレーニングして、カットオフ後のデータを予測します(特定のスライディングウィンドウサイズまで)。残りのケアレットを活用しながら、これをどのように実行するかを判断できませんでしたtrain()。ヒントを事前に感謝します。

4

1 に答える 1

4

ここでマックス。

カスタムのリサンプリング インデックスを trainControl(index = list()) で指定できます。このリストには、トレーニングに使用されるトレーニング データの要素が含まれています。

...しかし、 train() は他のすべてをホールドアウトとして使用しますが、それはあなたが望んでいることではないと思います。

この機能について、おそらく 10 件ほどの異なるリクエストがありました。これを行うには、train() にいくつかの変更が必要ですが、それほど悪くはありません。

ただし、1) 時系列分析については (単純な基礎を超えて) わからないので、1 つまたは 2 つのテスト例を含むプロトタイプ コードが役立つでしょう。これを行う時間があります。

したがって、いくつかの技術的なビットを貢献する意思があり、数か月待つことができる場合は、いくつかの変更を加えて行うことができます (どれだけ積極的に取り組みたいかによって、これを減らすことができます)。

さらに議論したい場合は、パッケージに記載されているアドレスにメールを送ってください.

于 2012-06-21T00:47:48.843 に答える