問題タブ [feature-engineering]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
662 参照

tensorflow - TensorFlow で CSV からカテゴリ特徴配列列によってマルチホット SparseTensor を作成する

これは、レコメンデーション システムでまばらな機能 (一部の ID 機能など) を処理する一般的な方法です。TensorFlow パイプライン用のデータを準備する便利な方法を探しています。

私は多くの検索を行いましたが、まだ良い解決策を見つけています。

以下は、私が必要としているものに近いと思われるものですが、まだ機能していません。

#######以下の部分を参照してください

データファイルは次のようになります。

2 行目では、マルチホットのような SparseTensor が必要です

コードの完全なバージョンは次のとおりです。

0 投票する
1 に答える
602 参照

python - 追加の引数を持つカスタム集計プリミティブ?

変換プリミティブは、追加の引数で正常に機能します。ここに例があります

出力:

ただし、次のように変更して集約プリミティブにする場合:

次のエラーが表示されます。

追加の引数を持つカスタム集計プリミティブは featuretools でサポートされていますか?

0 投票する
1 に答える
567 参照

machine-learning - テキスト機能を含むデータセットのロジスティック回帰

次のようなデータセットがあります。

これらが3つの列であるとしましょう。列 1 と 2 はテキスト機能であり、数値データではないことに注意してください。私の入力データには、15 ~ 20 の異なるタイプが含まれcategory 1ます。のこのタイプのそれぞれは、category 1のタイプを持つことができますcategory 2。例えば。タイプ2 回または 3 回Xのエントリと、タイプ 2 回のエントリを持つことができます。3 番目の列は出力です。そのようなデータセットでモデルをトレーニングしたいのですが、最終的にモデルがトレーニングされた後、&のいずれかを渡したいと思います。例: & - これにより、 orの予測出力が得られるはずです。この目的のためにロジスティック回帰を使用するつもりです。abcategory 1category 2Xa10

質問:

  1. テキストデータがあるので、ダミーを使用して、タイプごとに列を作成する必要がありますか? (たとえば、 があるので、 3 つの異なる列を作成してX、またはを割り当てる必要があります。YZ10

  2. これにロジスティック回帰を使用できますか、それとも私のアプリケーションに適していませんか? (私は予測の確率を得たいと思い1ます)

どんな提案も役に立ちます。