問題タブ [feature-engineering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - TensorFlow で CSV からカテゴリ特徴配列列によってマルチホット SparseTensor を作成する
これは、レコメンデーション システムでまばらな機能 (一部の ID 機能など) を処理する一般的な方法です。TensorFlow パイプライン用のデータを準備する便利な方法を探しています。
私は多くの検索を行いましたが、まだ良い解決策を見つけています。
以下は、私が必要としているものに近いと思われるものですが、まだ機能していません。
#######
以下の部分を参照してください
データファイルは次のようになります。
2 行目では、マルチホットのような SparseTensor が必要です
コードの完全なバージョンは次のとおりです。
python - 追加の引数を持つカスタム集計プリミティブ?
変換プリミティブは、追加の引数で正常に機能します。ここに例があります
出力:
ただし、次のように変更して集約プリミティブにする場合:
次のエラーが表示されます。
追加の引数を持つカスタム集計プリミティブは featuretools でサポートされていますか?
machine-learning - テキスト機能を含むデータセットのロジスティック回帰
次のようなデータセットがあります。
これらが3つの列であるとしましょう。列 1 と 2 はテキスト機能であり、数値データではないことに注意してください。私の入力データには、15 ~ 20 の異なるタイプが含まれcategory 1
ます。のこのタイプのそれぞれは、category 1
のタイプを持つことができますcategory 2
。例えば。タイプ2 回または 3 回X
のエントリと、タイプ 2 回のエントリを持つことができます。3 番目の列は出力です。そのようなデータセットでモデルをトレーニングしたいのですが、最終的にモデルがトレーニングされた後、&のいずれかを渡したいと思います。例: & - これにより、 orの予測出力が得られるはずです。この目的のためにロジスティック回帰を使用するつもりです。a
b
category 1
category 2
X
a
1
0
質問:
テキストデータがあるので、ダミーを使用して、タイプごとに列を作成する必要がありますか? (たとえば、 があるので、 3 つの異なる列を作成して
X
、またはを割り当てる必要があります。Y
Z
1
0
これにロジスティック回帰を使用できますか、それとも私のアプリケーションに適していませんか? (私は予測の確率を得たいと思い
1
ます)
どんな提案も役に立ちます。