時間単位でアーカイブされた多くの har ファイルがあり、月と日に基づいてデータを分析したいと考えています。ピッグロードでサポートされ、アーカイブされていないフォルダーとファイルでうまく機能するさまざまなワイルドカードマッチング方法を試しましたが、いずれも har では機能しません。
これは私が試した方法です:
LOAD 'har:///2015092???.har/2015092???/aaa/*/ttt.txt.gz'
LOAD 'har:///2015092{12,13}.har/2015092???/aaa/*/ttt.txt.gz' AS
複数の har ファイルを 1 つずつロードする代わりに、1 つの pig コマンドでロードする方法はありますか?