distcp がワイルドカードを使用できないことは承知しています。ただし、ディレクトリの変更時にスケジュールされたdistcpが必要になります。(つまり、月曜日の「金曜日」ディレクトリ内のデータのみをコピーするなど) だけでなく、指定されたディレクトリの下のすべてのプロジェクトからもコピーします。
この種のスクリプトを作成するための何らかのデザイン パターンはありますか?
要するに、私はできるようになりたいです:
hadoop distcp /foo/*/bar/$year/$month/$day hdfs://namespace-foo/replication-dir/