0

いくつか質問があります。

  1. トレーニング データとテストにおける randperm の機能は何ですか? この例のようなマルチクラス SVM (1 対すべて)なぜ randperm を使用する必要があるのか​​まだわかりませんか?

  2. 手書きのアルファベットのようなデータがある場合、例のリンクのように私の場合、randperm を使用できますか?

この問題の背景として使用できるリソース/論文はありますか? 助けが必要です、ありがとう。

4

1 に答える 1

0

1しか答えられません。

トレーニング セットのポイントは、一般化を作成することです。次に、一般化をテスト セットでテストして、一般化をテストします。新しいトレーニング セットとテスト セットを作成せずに学習アルゴリズムを微調整し、再トレーニング/再テストを行った場合、実際にはテスト セットを学習しているだけであり、一般化を開発していません。

トレーニング データとテスト データをシャッフルしても結果が安定している場合は、適切な一般化を学習した可能性が高くなります。

これは反復ホールドアウト法と呼ばれます。いくつかの方法の簡単な説明については、http: //www.umiacs.umd.edu/~joseph/classes/459M/year2010/Chapter5-testing-4on1.pdf を参照してください。alrikai がコメントで示唆したように、これは stats.stackexchange.com で議論されている種類の資料です。例: https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set

于 2013-06-18T20:56:22.987 に答える