このガイドに従って、リアルタイムの Web トラフィック データを S3 にロードし、Lambda を構成して ES ドメイン インデックスにロードします。現在、レコードごとに、この {GUID}.json のような名前の S3 バケットに、1 行のみを含む新しい json ファイルを作成しています。例えば:
{"email":"example@test.com","firstname":"Hello","lastname":"World"}
これがライブになると、何百万もの json ファイルが S3 バケットにアップロードされ、Lambda 関数を介して ES にプッシュされます。これはストリーミング データをロードする正しい方法ですか? または、1 時間ごとに複数のレコードを集約するスケジュール プロセスを開発する必要がありますか? 技術的には「リアルタイムストリーミング」ではない気がします。
助言がありますか?