4

次のような分割された fs 構造を提供します。

logs
└── log_type
    └── 2013
        ├── 07
        │   ├── 28
        │   │   ├── host1
        │   │   │   └── log_file_1.csv
        │   │   └── host2
        │   │       ├── log_file_1.csv
        │   │       └── log_file_2.csv
        │   └── 29
        │       ├── host1
        │       │   └── log_file_1.csv
        │       └── host2
        │           └── log_file_1.csv
        └── 08

Impalaで外部テーブルを作成しようとしています:

create external table log_type (
    field1    string,
    field2    string,
    ...
)
row format delimited fields terminated by '|' location '/logs/log_type/2013/08';

Impala がサブディレクトリに再帰し、すべての csv ファイルをロードすることを望みます。しかし葉巻はありません。エラーはスローされませんが、データはテーブルにロードされません。

さまざまなグロブが好きである/logs/log_type/2013/08/*/* か、/logs/log_type/2013/08/*/*/*機能しませんでした。

これを行う方法はありますか?または、fsを再構築する必要がありますか?それに関するアドバイスはありますか?

4

3 に答える 3