問題タブ [featuretools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
662 参照

python - Featuretools の複数のトレーニング ウィンドウで同じ機能を計算する

Featuretools は複数のカットオフ時間の処理をすでにサポートしています https://docs.featuretools.com/automated_feature_engineering/handling_time.html

しかし、ご覧のとおり、1 つの ID に対して複数の時点で pandas マルチ インデックスが生成されます。どのように (おそらくピボット経由で?) 代わりに、last_x_days_MIN/MAX/... で始まるすべての MIN/MAX/... 生成された列を取得して、カットオフ ウィンドウごとに追加機能を取得できますか?

希望の出力形式を編集する

0 投票する
1 に答える
1016 参照

python - FeatureTools: 多対多の関係を扱う

以下の 3 つを含む複数の列を持つ購入のデータフレームがあります。

ワーカーは関連付けられた複数のアカウントを持つことができ、アカウントは複数のワーカーを持つことができます。

WORKER エンティティと ACCOUNT エンティティを作成して関係を追加すると、エラーが発生します。

これまでの私のコードは次のとおりです。

エンティティを分離して多対多の関係を含めるにはどうすればよいですか?

0 投票する
1 に答える
35 参照

feature-engineering - Deep Feature Synthesis の使用時に FeatureTools によって導出された定数を記録する方法

FeatureTools が深い特徴合成を実行する場合、導出した定数値を記録する方法はありますか?

たとえば、次のような多くの行があります。 | loan_id | loan_term | |---------|:---------:| | a | 12 | | ... | ... | | z | 18 |

features以下のような DeepFeatureSynthesis エンジニア<Feature: loan_term.COUNT(loan)>: | loan | loan_term | loan_term.COUNT(loan) | |---------|:---------:|:---------------------:| | a | 12 | 2000 | | ... | ... | ... | | z | 18 | 800 |

単一のエンティティから機能を再設計できるようにしたいと考えています。これにより、データフレーム内のすべての を再カウントすることなく、単一のローン期間12がになります。*loan_term.COUNT(loan)2000loan_term

エンティティとトレーニング データを再結合することでこれを行うことができます ft.calculate_feature_matrix(features, my_entity_set_with_one_new_entity_added)が、これは非効率的で時間がかかります。

深い機能合成中に見つかった定数を記録し、将来の機能生成に使用するように FeatureTools に指示する方法はありますか?


*現時点では、単一の新しいローン エンティティを計算に含めることは重要ではありません。そう12なる必要はありません2001