Prediction.IO
レコメンドエンジンに使用しています。
デプロイ (pio deploy) 後、デプロイ後に作成された Web サービスを呼び出して、必要に応じて一度に 1 人のユーザーの推奨結果を取得できます。多くのユーザーに対して、1 回の呼び出しで多くのリクエストを送信することもできます。
何十億ものイベントと何億ものユーザー エンティティがあるため、http ポートから Web サービスを使用することは、たとえば Hive でデータをエクスポートして分析するための高速な方法ではありません。
問題は、すべてのユーザーの推奨事項をエクスポートする方法を見つけることができなかったことです (ユーザーごとに 10 個の推奨事項があるとします)。
すべてのイベント データをエクスポートするコマンド (pio export) がありますが、これにはスコア値や推奨結果は含まれません。
結果を一括エクスポートする方法を見つけることについて何か考えはありますか?