HDFS の場所 (/user/hive/warehouse/tableX) のすべてのファイルからデータを読み取る外部テーブルがあり、Hive に外部テーブルを作成しました。
ここで、データの事前パーティション化があり、以前のすべてのファイルが特定の名前規則 < dir_name >_< incNumber > などでいくつかのディレクトリに吐き出されていると仮定しましょう。
/user/hive/warehouse/split/
./dir_1/files...
./dir_2/files...
./dir_n/files...
分割フォルダー内のすべてのファイルを追跡する別の外部テーブルを作成するにはどうすればよいですか?
各サブフォルダー (dir_x) でパーティション分割された外部テーブルを作成する必要がありますか?
また、そのために、サブディレクトリごとにパーティションを作成/追加できるある種のハイブまたはシェルスクリプトが必要ですか?