問題タブ [iris-dataset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
141 参照

python - アイリス データセットとのエンコードの不一致

データセットを iris.data としてダウンロードした後、名前を iris.data.txt に変更しました。SOで報告されたこのエラーを回避しようとしていました:

読んだ後、私はこれを試しました:

これによりエラーは部分的に解決されましたが、一部の行はまだガベージでした。

次に、Sublimeで開いて、utf-8エンコーディングで保存してから、dataset = pd.read_csv('iris.data.txt', header=None, names=names,encoding="utf-8")

しかし、これでも問題は解決しません。Mac OS で Python 3 を実行しています。データを直接読み取ることができる可能性があるのは何ですか?

[編集]: データ型の読み取り: Web アーカイブ。Spyder では、ファイルは iris.data.webarchive として表示されます

試してみるとdataset = pd.read_csv('iris.data.webarchive', header=None)、次のトレースバックが表示されます。

私が試してみるとdataset = pd.read_csv('iris.data', header=None)、それはFileNotFoundError: File b'iris.data' does not exist

0 投票する
2 に答える
1807 参照

machine-learning - Azure Machine Learning のランダム シードとは何ですか?

Azure Machine Learning を学んでいます。次のようないくつかの手順でランダムシードに頻繁に遭遇します。

  1. 分割データ
  2. 2 クラス回帰、マルチクラス回帰、ツリー、フォレストなどのトレーニングされていないアルゴリズム モデル。

チュートリアルでは、ランダム シードを「123」として選択します。訓練されたモデルは高い精度を持っていますが、245、256、12、321 などの他のランダムな整数を選択しようとすると、うまくいきませんでした。


質問

  • ランダムシード整数とは何ですか?
  • 整数値の範囲からランダムシードを慎重に選択するには? それを選択するための鍵または戦略は何ですか?
  • ランダム シードがトレーニング済みモデルの ML スコアリング、予測、および品質に大きな影響を与えるのはなぜですか?

口実

  1. がく片(長さ & 幅) と花びら (長さ & 幅)を含むIris-Sepal-Petal-Datasetがあります。
  2. データセットの最後の列は「Binomial ClassName」です
  3. マルチクラス デシジョン フォレスト アルゴリズムを使用してデータセットをトレーニングし、データを異なるランダム シード 321、123、および 12345 で順番に分割しています。
  4. トレーニング済みモデルの最終的な品質に影響します。ランダム シード #123 が最高の予測確率スコア: 1.

ML Studio スナップ


観察

1.ランダムシード:321

ランダムシード-321

2.ランダムシード:123

ランダムシード-123

3. ランダム シード: 12345

ランダムシード-12345

0 投票する
1 に答える
113 参照

data-science - knn を使用したアイリス データ プロット。実行ごとに異なるプロットが得られます。(アナコンダでスパイダーを使用)

こんにちは、データ サイエンスと Python は初めてです。pandas、matplotlib を使用して knn 分類プログラムを作成しようとしていました。私はスパイダー Ide を使用しています。各実行プロットは変化し続けます。私は非常に混乱しています、それは正しいですか、それとも私はいくつかの間違いをしました、

初回実行時

2 回目の実行時 何らかの結論を導き出せるように、プロットを固定するにはどうすればよいですか?