いくつか質問があります。
トレーニング データとテストにおける randperm の機能は何ですか? この例のようなマルチクラス SVM (1 対すべて)なぜ randperm を使用する必要があるのかまだわかりませんか?
手書きのアルファベットのようなデータがある場合、例のリンクのように私の場合、randperm を使用できますか?
この問題の背景として使用できるリソース/論文はありますか? 助けが必要です、ありがとう。
いくつか質問があります。
トレーニング データとテストにおける randperm の機能は何ですか? この例のようなマルチクラス SVM (1 対すべて)なぜ randperm を使用する必要があるのかまだわかりませんか?
手書きのアルファベットのようなデータがある場合、例のリンクのように私の場合、randperm を使用できますか?
この問題の背景として使用できるリソース/論文はありますか? 助けが必要です、ありがとう。
1しか答えられません。
トレーニング セットのポイントは、一般化を作成することです。次に、一般化をテスト セットでテストして、一般化をテストします。新しいトレーニング セットとテスト セットを作成せずに学習アルゴリズムを微調整し、再トレーニング/再テストを行った場合、実際にはテスト セットを学習しているだけであり、一般化を開発していません。
トレーニング データとテスト データをシャッフルしても結果が安定している場合は、適切な一般化を学習した可能性が高くなります。
これは反復ホールドアウト法と呼ばれます。いくつかの方法の簡単な説明については、http: //www.umiacs.umd.edu/~joseph/classes/459M/year2010/Chapter5-testing-4on1.pdf を参照してください。alrikai がコメントで示唆したように、これは stats.stackexchange.com で議論されている種類の資料です。例: https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set