0

HDFS データを Dynamo にコピーするときに、デフォルトの範囲キー値を設定したいと考えています。これまでのところ、入力が 3 列で DB が 3 列であるストレート マッピングを行うこれがあります。

CREATE EXTERNAL TABLE hdfs_table (a_col string, b_col string, c_col string)
 ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
 LOCATION "hdfs:///blahblah";

CREATE EXTERNAL TABLE dynamodb_table (c1 string, c2 string, c3 string)
 STORED BY 'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler'
 TBLPROPERTIES ("dynamodb.table.name" = "output_table",
                "dynamodb.column.mapping" = "c1:id,c2:timestamp,c3:data");

INSERT OVERWRITE TABLE dynamodb_table SELECT * FROM hdfs_table;

基本的に4番目の列である範囲キーを使用して、新しい出力テーブルを設定しました。このスクリプトにパラメーターとして渡される値に範囲キーを設定したいと思います。SQL ALTERandに似た何かをしたいと思いますSET DEFAULT。任意のポインタをいただければ幸いです。

4

1 に答える 1