問題タブ [one-hot-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 2次元マトリックスを3次元ワンホットマトリックスnumpyに変換する
np 行列があり、要素を 3 次元として 1 つのホット エンコーディングで 3D 配列に変換したいと考えています。各行をループせずに行う方法はありますか?
にする必要があります
python - ワンホットエンコーダー:同じカテゴリの複数の値をエンコードする方法は?
映画の興行収入を予測します。値「A」、「B」、「C」を持つカテゴリ機能「俳優」が1つだけあると仮定します。そして、それらを次[1,0,0],[0,1,0],[0,0,1]
のようにエンコードします。映画に複数の俳優、たとえばAとBの両方がいる場合、それをエンコードする必要があります[1,1,0]
またはとして[1,0,0,0,1,0]
python - Pythonでホットエンコードするにはどうすればよいですか?
カテゴリ変数が 80% の機械学習分類問題があります。分類に分類器を使用したい場合、1 つのホット エンコーディングを使用する必要がありますか? エンコーディングなしでデータを分類子に渡すことはできますか?
機能選択のために次のことをしようとしています。
私は電車のファイルを読みました:
/li>カテゴリ機能のタイプを「カテゴリ」に変更します。
/li>私は 1 つのホット エンコーディングを使用します。
/li>
問題は、強力なマシンを使用しているにもかかわらず、3 番目の部分が頻繁に動かなくなることです。
したがって、1 つのホット エンコーディングがなければ、機能の重要性を判断するために機能を選択することはできません。
おすすめは何ですか?
python - Python でのテスト データの 1-hot エンコーディング
私は分類問題に取り組んでいます。トレーニング データには、ダミー変数に変換したいいくつかのカテゴリ変数があります。これは、パンダで簡単に実行できます。
問題は、テスト データに、トレーニング データには存在しないレベルが含まれている場合はどうなるかということです。テスト データを、トレーニング データと同じスキーマを持つ 1-hotcoded データに変換するにはどうすればよいですか?
例えば:
列車データ
1-hot エンコードされた列車データ
テストデータ
問題は、これをダミー変数に直接変換できないことです。これは、2 つの属性dummy_attr_a
とdummy_attr_e
(トレーニング データには存在しない) しか作成しないためです。
python - 1 つのセルに複数の値を持つ 1 つのホット エンコーディングを行うにはどうすればよいですか?
私はExcelでこのテーブルを持っています:
ここで、Python で「特別な」ワンホット エンコーディングを実行したいと考えています。最初のテーブルの各 ID には、2 つの数字があります。各番号はクラス (class1、class2 など) に対応しています。2 番目のテーブルは最初のテーブルに基づいて作成され、各 ID について、その行の各数値が対応するクラス列に表示され、他の列はゼロになります。たとえば、id 0 の番号は 2 と 3 です。2 は class2 に配置され、3 は class3 に配置されます。クラス 1、4、および 5 はデフォルトの 0 を取得します。結果は次のようになります。
私の以前の解決策、
結果:
(class_3 が 2 回表示されます)。これを修正するにはどうすればよいですか? (このステップの後、必要な最終的な形式に変換できます。)
python - OneHotEncoder 後の変換解除
sklearn の OneHotEncoder を使用していますが、データの変換を解除したいと考えています。それを行う方法はありますか?
しかし、私は次のことができるようにしたい:
どうすればこれを行うことができますか?
コンテキストとして、ワンホット エンコーディング スペースを学習するニューラル ネットワークを構築しました。今度は nn を使用して、元のデータ形式である必要がある実際の予測を行いたいと考えています。
r - 「dmap_if」と「model.matrix」を一緒に
Arthritis
パッケージのデータ セットを使用vcd
して、1 つのホット エンコーディングを実行しています。purrr::dmap_if
これを行うには、 and をMatrix::model.matrix
一緒に使用したいと思います。私が走るとき
正常に動作しています。
以下のコードを使用すると機能しません
python - sklearn で OneHotEncoder からの出力を使用するには?
2 つのカテゴリ変数、ID 変数、およびターゲット変数 (分類用) を持つ Pandas Dataframe があります。でカテゴリ値を変換することができましたOneHotEncoder
。これにより、スパース マトリックスが生成されます。
しかし、DecisionTreeClassifier でこの疎行列を使用する方法がわかりません。特に、後でデータフレームに他の非カテゴリ変数を追加したい場合。ありがとう!
編集 miraculixx のコメントへの返信: sklearn-pandas で DataFrameMapper も試しました
しかし、その後、次のエラーが発生します。
TypeError: サポートされていない型の変換: (dtype('O'), dtype('int64'), dtype('float64'), dtype('float64'))。
python - numpy を使用したワンホット エンコーディング
入力がゼロの場合、次のような配列を作成します。
入力が 5 の場合:
上記について、私は次のように書きました。
しかし、うまくいきませんでした。
これを1行で実装できる方法はありますか?