問題タブ [iris-dataset]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

82 問題

0 投票する

1 に答える

141 参照

python - アイリスデータセットとのエンコードの不一致

データセットを iris.data としてダウンロードした後、名前を iris.data.txt に変更しました。SOで報告されたこのエラーを回避しようとしていました:

読んだ後、私はこれを試しました：

これによりエラーは部分的に解決されましたが、一部の行はまだガベージでした。

次に、Sublimeで開いて、utf-8エンコーディングで保存してから、dataset = pd.read_csv('iris.data.txt', header=None, names=names,encoding="utf-8")

しかし、これでも問題は解決しません。Mac OS で Python 3 を実行しています。データを直接読み取ることができる可能性があるのは何ですか?

[編集]: データ型の読み取り: Web アーカイブ。Spyder では、ファイルは iris.data.webarchive として表示されます

試してみるとdataset = pd.read_csv('iris.data.webarchive', header=None)、次のトレースバックが表示されます。

私が試してみるとdataset = pd.read_csv('iris.data', header=None)、それはFileNotFoundError: File b'iris.data' does not exist

2018-09-01T03:24:57.757

0 投票する

2 に答える

1807 参照

machine-learning - Azure Machine Learning のランダムシードとは何ですか?

Azure Machine Learning を学んでいます。次のようないくつかの手順でランダムシードに頻繁に遭遇します。

分割データ
2 クラス回帰、マルチクラス回帰、ツリー、フォレストなどのトレーニングされていないアルゴリズムモデル。

チュートリアルでは、ランダムシードを「123」として選択します。訓練されたモデルは高い精度を持っていますが、245、256、12、321 などの他のランダムな整数を選択しようとすると、うまくいきませんでした。

質問

ランダムシード整数とは何ですか?
整数値の範囲からランダムシードを慎重に選択するには? それを選択するための鍵または戦略は何ですか？
ランダムシードがトレーニング済みモデルの ML スコアリング、予測、および品質に大きな影響を与えるのはなぜですか?

口実

がく片(長さ & 幅) と花びら (長さ & 幅)を含むIris-Sepal-Petal-Datasetがあります。
データセットの最後の列は「Binomial ClassName」です
マルチクラスデシジョンフォレストアルゴリズムを使用してデータセットをトレーニングし、データを異なるランダムシード 321、123、および 12345 で順番に分割しています。
トレーニング済みモデルの最終的な品質に影響します。ランダムシード #123 が最高の予測確率スコア: 1.

観察

1.ランダムシード：321

2.ランダムシード：123

3. ランダムシード: 12345

machine-learning azure-machine-learning-studio random-seed iris-dataset

2019-07-02T08:27:18.867

0 投票する

1 に答える

113 参照

data-science - knn を使用したアイリスデータプロット。実行ごとに異なるプロットが得られます。(アナコンダでスパイダーを使用)

こんにちは、データサイエンスと Python は初めてです。pandas、matplotlib を使用して knn 分類プログラムを作成しようとしていました。私はスパイダー Ide を使用しています。各実行プロットは変化し続けます。私は非常に混乱しています、それは正しいですか、それとも私はいくつかの間違いをしました、

何らかの結論を導き出せるように、プロットを固定するにはどうすればよいですか?

data-science spyder iris-dataset

2019-10-25T09:07:23.553

1 2 3 4 5 6 7 8 9 10

問題タブ [iris-dataset]

python - アイリス データセットとのエンコードの不一致

machine-learning - Azure Machine Learning のランダム シードとは何ですか?

data-science - knn を使用したアイリス データ プロット。実行ごとに異なるプロットが得られます。(アナコンダでスパイダーを使用)

Reference

python - アイリスデータセットとのエンコードの不一致

machine-learning - Azure Machine Learning のランダムシードとは何ですか?

data-science - knn を使用したアイリスデータプロット。実行ごとに異なるプロットが得られます。(アナコンダでスパイダーを使用)