問題タブ [one-hot-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 各行にリストがあるデータフレームをワンホット エンコードする方法
データのリスト内にリストを持つデータを機械学習アルゴリズムにフィードしようとしています:
たとえば、患者にはいくつかの薬があり、薬に対するいくつかの反応があり、名前もある場合があります。そのため、複数の薬を服用している場合は、2 つ以上のリストとして表示されます。名前は 1 つだけです。
ワンホット エンコーディングが正しい方法だと思います。
これが私がこれまでに行ったことです:
私はデータフレームを持っています:
次のようなものを取得したい:
私はこれを試しました:
しかし得た:
r - データ フレームを 1 つのホット エンコードに変換する方法
ID が複数のイベント タイプを持つことができるデータ フレームがあります。
フォーマットに変換したい
Rでこれを達成する最良の方法は何ですか? パッケージはありますか?私はダミーを使ってみました:
new_my_data <- dummy.data.frame(eventtype, names = c("event_type1", "event_type2", "event_type3", "event_type4", "event_type5")
しかし、うまくいきません。私も検索しようとしましたが、この特定の問題の解決策を見ることができました。ほぼすべての投稿は、1 つのホット エンコーディングがすべての人に知られていることを前提としています。
助けてください。