リアルタイムでデータを蓄積するプロジェクトに取り組んでいます。そのデータをローカル マシンから HDFS に定期的にアップロードしたいと考えています。ここでの頻度は数時間ごとになります。
私の考えは、定期的に 2 時間後にバッチ ファイルを実行するようにスケジュールすることです。
リアルタイムでデータを蓄積するプロジェクトに取り組んでいます。そのデータをローカル マシンから HDFS に定期的にアップロードしたいと考えています。ここでの頻度は数時間ごとになります。
私の考えは、定期的に 2 時間後にバッチ ファイルを実行するようにスケジュールすることです。