次のような分割された fs 構造を提供します。
logs
└── log_type
└── 2013
├── 07
│ ├── 28
│ │ ├── host1
│ │ │ └── log_file_1.csv
│ │ └── host2
│ │ ├── log_file_1.csv
│ │ └── log_file_2.csv
│ └── 29
│ ├── host1
│ │ └── log_file_1.csv
│ └── host2
│ └── log_file_1.csv
└── 08
Impalaで外部テーブルを作成しようとしています:
create external table log_type (
field1 string,
field2 string,
...
)
row format delimited fields terminated by '|' location '/logs/log_type/2013/08';
Impala がサブディレクトリに再帰し、すべての csv ファイルをロードすることを望みます。しかし葉巻はありません。エラーはスローされませんが、データはテーブルにロードされません。
さまざまなグロブが好きである/logs/log_type/2013/08/*/*
か、/logs/log_type/2013/08/*/*/*
機能しませんでした。
これを行う方法はありますか?または、fsを再構築する必要がありますか?それに関するアドバイスはありますか?