Azure Machine Learning を学んでいます。次のようないくつかの手順でランダムシードに頻繁に遭遇します。
- 分割データ
- 2 クラス回帰、マルチクラス回帰、ツリー、フォレストなどのトレーニングされていないアルゴリズム モデル。
チュートリアルでは、ランダム シードを「123」として選択します。訓練されたモデルは高い精度を持っていますが、245、256、12、321 などの他のランダムな整数を選択しようとすると、うまくいきませんでした。
質問
- ランダムシード整数とは何ですか?
- 整数値の範囲からランダムシードを慎重に選択するには? それを選択するための鍵または戦略は何ですか?
- ランダム シードがトレーニング済みモデルの ML スコアリング、予測、および品質に大きな影響を与えるのはなぜですか?
口実
- がく片(長さ & 幅) と花びら (長さ & 幅)を含むIris-Sepal-Petal-Datasetがあります。
- データセットの最後の列は「Binomial ClassName」です
- マルチクラス デシジョン フォレスト アルゴリズムを使用してデータセットをトレーニングし、データを異なるランダム シード 321、123、および 12345 で順番に分割しています。
- トレーニング済みモデルの最終的な品質に影響します。ランダム シード #123 が最高の予測確率スコア: 1.
観察
1.ランダムシード:321
2.ランダムシード:123
3. ランダム シード: 12345