問題タブ [label-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - ラベルのエンコーディングは出力ラベルに十分ですか?
序数の特徴については、ラベルのエンコーディングを使用するのが理にかなっています。ただし、カテゴリ機能については、1 つのホット エンコーディングを使用します。ただし、これらは入力機能の規則です。しかし、出力ラベルがカテゴリーである場合、出力変数に対して 1 つのホット エンコーディングを使用する必要がありますか? または、ラベルのエンコーディングも使用できますか? どちらが好ましいですか?
120 クラスの果物分類器をトレーニングしています。ImageNet で事前トレーニングされた ResNet50 モデルを特徴抽出器として使用しており、これらの機能を使用してロジスティック回帰分類器 (転移学習) をトレーニングしています。120 個のクラスがあるため、ラベル エンコーディングの場合、ラベルの範囲は 0 から 119 になります。ラベル エンコーディングを維持したままモデルをトレーニングしても問題ありませんか? 私がこれを求めているのは、次の sklearn のドキュメントで許可されているためです。
sklearn.preprocessing.LabelEncoder
ここで彼らは言っています:
...「このトランスフォーマーは、入力 X ではなく、ターゲット値、つまり y をエンコードするために使用する必要があります。」
しかし、ラベル エンコーディングでは、出力変数のそれぞれが、1 つのホット エンコーディングを使用した場合と同じ優先度を得られないため、なぜそうしてもよいのか混乱しています。
python - 保存されたモデル (ランダム フォレスト) が「フレッシュ フィット」モデルとして機能しない - カテゴリ変数の問題
scikit-learn (ランダム フォレスト) でモデルを作成し、保存しました。次に、このモデルを再度読み込み、トレーニングに使用したのと同じデータセットに適用しようとしました。そして、エラーメッセージが表示されます
「文字列を float に変換できませんでした」
いくつかのカテゴリ変数があるためです。しかし、モデルを保存する前に、エラーなしでこのモデルをこのデータ セットに適用できました。問題は、モデルを保存したときに、これらの 2 つのカテゴリ変数に関する情報が保存されなかったことです。実際のところLabelencoder
、これらの変数に使用しました。これらのカテゴリ変数に関する情報を保存して、保存されたモデルが「フレッシュフィット」モデルと同様に機能する方法はありますか? 前もって感謝します!
python-3.x - tkinter でテキストのリストを表示する
Python で関数をtkinter
使用して表示するように、ラベルのエンコードの結果を表示したいと考えています。print
このコードは、次のような結果を生成します。
tkinter で同じことを行うにはどうすればよいですか?次のコードを使用しましたが、エラーが発生しました。私の目標は、エンコードされた REPORT_FAMILY 列を REPORT_FAMILY のそれぞれのカテゴリに表示することです。
次のエラーが表示されます。