5

ハイブを使用してデータを分析し、hdfsファイルシステムに送信するcassandraに大きなデータセットがあります。appName でグループ化し、appName に応じてデータを異なる hdfs ファイル システムに送信することは可能でしょうか (アプリ名は事前定義されていないことに注意してください)。

appName データ

a1 abc

a1 pqr

a1qwe

a2私の

a2データ

a2 abc

a2bnm

a3エラー

a3 asf

a4 abc123

a1 データセット ->/apps/a1 a2 データセット ->/apps/a2 ect

4

1 に答える 1

1

動的パーティション: https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-DynamicpartitionInsertが適しているかもしれません。
HDFS でパスを選択することはできませんが、異なるアプリは異なるフォルダーに移動します。

于 2013-09-23T16:36:21.073 に答える