1

展開ページに記載されている機能ツール「v0.7.0」の展開方法を参照してください

メソッドを使用してfeature_defsを保存しましft.save_featuresたが、defsを正常にロードするft.load_featuresと、次の依存関係が機能マトリックスを計算することがわかりました。ft.calculate_feature_matrixEntitySetです!

持続する方法がないことがわかりましたEntitySet。メソッドしか見つかりEntitySet.to_pickle()ませんでしたが、ピクルからロードするものは何もありませんでした!

機能を追加したい新しいデータフレームがありますが、親データフレームまたはエンティティセットがないと不可能です。

何か見逃した場合は、親切にアドバイスしてください。

Entityset: None
  Entities:
    branches [Rows: 82, Columns: 1]
    suppliers [Rows: 2953, Columns: 1]
    manufacturers [Rows: 11, Columns: 1]
    states [Rows: 22, Columns: 1]
    employees [Rows: 3270, Columns: 1]
    pincodes [Rows: 6698, Columns: 1]
    customers [Rows: 233154, Columns: 38]
  Relationships:
    customers.branch_id -> branches.branch_id
    customers.supplier_id -> suppliers.supplier_id
    customers.manufacturer_id -> manufacturers.manufacturer_id
    customers.state_id -> states.state_id
    customers.employee_code_id -> employees.employee_code_id
    customers.current_pincode_id -> pincodes.current_pincode_id

ft.save_features(features_defs_branches, 'branches.ft')

計算する別の顧客がいます。どうすればいいですか?

つまり。

new_predictions.py

df_new_customers = pd.read_csv('customers.csv')

features_loaded = ft.load_features('branches.ft')
feature_matrix = ft.calculate_feature_matrix(features_loaded, ?)
4

1 に答える 1

1

上記の例では、同じエンティティを作成して新しいデータを設定する必要がありますdf_new_customers。新しいデータのエンティティセットを取得したら、特徴を読み込んで計算できます。

以前に保存したエンティティを読みたい場合は、 を使用できますfeaturetools.read_entityset('path/to/entityset/')。すべてのシリアル化方法はこちらで確認できます。そうは言っても、この状況では、エンティティセットをシリアル化および逆シリアル化する必要はないと思います。

于 2019-04-15T15:49:22.157 に答える