問題タブ [one-hot-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
11010 参照

python - 2次元マトリックスを3次元ワンホットマトリックスnumpyに変換する

np 行列があり、要素を 3 次元として 1 つのホット エンコーディングで 3D 配列に変換したいと考えています。各行をループせずに行う方法はありますか?

にする必要があります

0 投票する
1 に答える
83 参照

python - ワンホットエンコーダー:同じカテゴリの複数の値をエンコードする方法は?

映画の興行収入を予測します。値「A」、「B」、「C」を持つカテゴリ機能「俳優」が1つだけあると仮定します。そして、それらを次[1,0,0],[0,1,0],[0,0,1]のようにエンコードします。映画に複数の俳優、たとえばAとBの両方がいる場合、それをエンコードする必要があります[1,1,0]またはとして[1,0,0,0,1,0]

0 投票する
21 に答える
400776 参照

python - Pythonでホットエンコードするにはどうすればよいですか?

カテゴリ変数が 80% の機械学習分類問題があります。分類に分類器を使用したい場合、1 つのホット エンコーディングを使用する必要がありますか? エンコーディングなしでデータを分類子に渡すことはできますか?

機能選択のために次のことをしようとしています。

  1. 私は電車のファイルを読みました:

    /li>
  2. カテゴリ機能のタイプを「カテゴリ」に変更します。

    /li>
  3. 私は 1 つのホット エンコーディングを使用します。

    /li>

問題は、強力なマシンを使用しているにもかかわらず、3 番目の部分が頻繁に動かなくなることです。

したがって、1 つのホット エンコーディングがなければ、機能の重要性を判断するために機能を選択することはできません。

おすすめは何ですか?

0 投票する
0 に答える
48 参照

python - Python でのテスト データの 1-hot エンコーディング

私は分類問題に取り組んでいます。トレーニング データには、ダミー変数に変換したいいくつかのカテゴリ変数があります。これは、パンダで簡単に実行できます。

問題は、テスト データに、トレーニング データには存在しないレベルが含まれている場合はどうなるかということです。テスト データを、トレーニング データと同じスキーマを持つ 1-hotcoded データに変換するにはどうすればよいですか?

例えば:

列車データ

1-hot エンコードされた列車データ

テストデータ

問題は、これをダミー変数に直接変換できないことです。これは、2 つの属性dummy_attr_adummy_attr_e(トレーニング データには存在しない) しか作成しないためです。

0 投票する
4 に答える
7360 参照

python - 1 つのセルに複数の値を持つ 1 つのホット エンコーディングを行うにはどうすればよいですか?

私はExcelでこのテーブルを持っています:

ここで、Python で「特別な」ワンホット エンコーディングを実行したいと考えています。最初のテーブルの各 ID には、2 つの数字があります。各番号はクラス (class1、class2 など) に対応しています。2 番目のテーブルは最初のテーブルに基づいて作成され、各 ID について、その行の各数値が対応するクラス列に表示され、他の列はゼロになります。たとえば、id 0 の番号は 2 と 3 です。2 は class2 に配置され、3 は class3 に配置されます。クラス 1、4、および 5 はデフォルトの 0 を取得します。結果は次のようになります。

私の以前の解決策、

結果:

(class_3 が 2 回表示されます)。これを修正するにはどうすればよいですか? (このステップの後、必要な最終的な形式に変換できます。)

0 投票する
1 に答える
1024 参照

python - OneHotEncoder 後の変換解除

sklearn の OneHotEncoder を使用していますが、データの変換を解除したいと考えています。それを行う方法はありますか?

しかし、私は次のことができるようにしたい:

どうすればこれを行うことができますか?

コンテキストとして、ワンホット エンコーディング スペースを学習するニューラル ネットワークを構築しました。今度は nn を使用して、元のデータ形式である必要がある実際の予測を行いたいと考えています。

0 投票する
1 に答える
143 参照

r - 「dmap_if」と「model.matrix」を一緒に

Arthritisパッケージのデータ セットを使用vcdして、1 つのホット エンコーディングを実行しています。purrr::dmap_ifこれを行うには、 and をMatrix::model.matrix一緒に使用したいと思います。私が走るとき

正常に動作しています。

以下のコードを使用すると機能しません

0 投票する
2 に答える
9936 参照

python - sklearn で OneHotEncoder からの出力を使用するには?

2 つのカテゴリ変数、ID 変数、およびターゲット変数 (分類用) を持つ Pandas Dataframe があります。でカテゴリ値を変換することができましたOneHotEncoder。これにより、スパース マトリックスが生成されます。

しかし、DecisionTreeClassifier でこの疎行列を使用する方法がわかりません。特に、後でデータフレームに他の非カテゴリ変数を追加したい場合。ありがとう!

編集 miraculixx のコメントへの返信: sklearn-pandas で DataFrameMapper も試しました

しかし、その後、次のエラーが発生します。

TypeError: サポートされていない型の変換: (dtype('O'), dtype('int64'), dtype('float64'), dtype('float64'))。

0 投票する
9 に答える
92564 参照

python - numpy を使用したワンホット エンコーディング

入力がゼロの場合、次のような配列を作成します。

入力が 5 の場合:

上記について、私は次のように書きました。

しかし、うまくいきませんでした。

これを1行で実装できる方法はありますか?