問題タブ [feature-engineering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - TensorFlow で CSV からカテゴリ特徴配列列によってマルチホット SparseTensor を作成する
これは、レコメンデーション システムでまばらな機能 (一部の ID 機能など) を処理する一般的な方法です。TensorFlow パイプライン用のデータを準備する便利な方法を探しています。
私は多くの検索を行いましたが、まだ良い解決策を見つけています。
以下は、私が必要としているものに近いと思われるものですが、まだ機能していません。
#######以下の部分を参照してください
データファイルは次のようになります。
2 行目では、マルチホットのような SparseTensor が必要です
コードの完全なバージョンは次のとおりです。
python - 追加の引数を持つカスタム集計プリミティブ?
変換プリミティブは、追加の引数で正常に機能します。ここに例があります
出力:
ただし、次のように変更して集約プリミティブにする場合:
次のエラーが表示されます。
追加の引数を持つカスタム集計プリミティブは featuretools でサポートされていますか?
machine-learning - テキスト機能を含むデータセットのロジスティック回帰
次のようなデータセットがあります。
これらが3つの列であるとしましょう。列 1 と 2 はテキスト機能であり、数値データではないことに注意してください。私の入力データには、15 ~ 20 の異なるタイプが含まれcategory 1ます。のこのタイプのそれぞれは、category 1のタイプを持つことができますcategory 2。例えば。タイプ2 回または 3 回Xのエントリと、タイプ 2 回のエントリを持つことができます。3 番目の列は出力です。そのようなデータセットでモデルをトレーニングしたいのですが、最終的にモデルがトレーニングされた後、&のいずれかを渡したいと思います。例: & - これにより、 orの予測出力が得られるはずです。この目的のためにロジスティック回帰を使用するつもりです。abcategory 1category 2Xa10
質問:
テキストデータがあるので、ダミーを使用して、タイプごとに列を作成する必要がありますか? (たとえば、 があるので、 3 つの異なる列を作成して
X、またはを割り当てる必要があります。YZ10これにロジスティック回帰を使用できますか、それとも私のアプリケーションに適していませんか? (私は予測の確率を得たいと思い
1ます)
どんな提案も役に立ちます。