問題タブ [iris-dataset]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - アイリス データセットとのエンコードの不一致
データセットを iris.data としてダウンロードした後、名前を iris.data.txt に変更しました。SOで報告されたこのエラーを回避しようとしていました:
読んだ後、私はこれを試しました:
これによりエラーは部分的に解決されましたが、一部の行はまだガベージでした。
次に、Sublimeで開いて、utf-8エンコーディングで保存してから、dataset = pd.read_csv('iris.data.txt', header=None, names=names,encoding="utf-8")
しかし、これでも問題は解決しません。Mac OS で Python 3 を実行しています。データを直接読み取ることができる可能性があるのは何ですか?
[編集]: データ型の読み取り: Web アーカイブ。Spyder では、ファイルは iris.data.webarchive として表示されます
試してみるとdataset = pd.read_csv('iris.data.webarchive', header=None)
、次のトレースバックが表示されます。
私が試してみるとdataset = pd.read_csv('iris.data', header=None)
、それはFileNotFoundError: File b'iris.data' does not exist
machine-learning - Azure Machine Learning のランダム シードとは何ですか?
Azure Machine Learning を学んでいます。次のようないくつかの手順でランダムシードに頻繁に遭遇します。
- 分割データ
- 2 クラス回帰、マルチクラス回帰、ツリー、フォレストなどのトレーニングされていないアルゴリズム モデル。
チュートリアルでは、ランダム シードを「123」として選択します。訓練されたモデルは高い精度を持っていますが、245、256、12、321 などの他のランダムな整数を選択しようとすると、うまくいきませんでした。
質問
- ランダムシード整数とは何ですか?
- 整数値の範囲からランダムシードを慎重に選択するには? それを選択するための鍵または戦略は何ですか?
- ランダム シードがトレーニング済みモデルの ML スコアリング、予測、および品質に大きな影響を与えるのはなぜですか?
口実
- がく片(長さ & 幅) と花びら (長さ & 幅)を含むIris-Sepal-Petal-Datasetがあります。
- データセットの最後の列は「Binomial ClassName」です
- マルチクラス デシジョン フォレスト アルゴリズムを使用してデータセットをトレーニングし、データを異なるランダム シード 321、123、および 12345 で順番に分割しています。
- トレーニング済みモデルの最終的な品質に影響します。ランダム シード #123 が最高の予測確率スコア: 1.
観察
1.ランダムシード:321
2.ランダムシード:123
3. ランダム シード: 12345