0

hdfsに複数の既存のテーブルが保存されています。データをバケット化、ソート、および圧縮できるように、既存の外部テーブルから新しいテーブルを作成したいと考えています。

既存のテーブルからテーブルを作成する適切な方法は何ですか? 既存のテーブルを CSV にエクスポートし、新しいテーブルを作成してインポートできますが、既存のテーブルから直接データをインポートする方法があるようですが、ドキュメントや Google 経由で何も見つかりませんでした。

4

1 に答える 1

1

名前: という名前の既存のテーブルと、フィールドを持つ:sourceという名前の新しく作成されたテーブルの場合:targeta,b,c,d

ソースからすべてのエントリを読み取り、ターゲットに書き込みます。

insert overwrite table target select distinct a,b,c,d from source;

これは、内部テーブルと外部テーブルの両方で機能します。

于 2015-07-13T21:43:20.067 に答える