HDFS データを Dynamo にコピーするときに、デフォルトの範囲キー値を設定したいと考えています。これまでのところ、入力が 3 列で DB が 3 列であるストレート マッピングを行うこれがあります。
CREATE EXTERNAL TABLE hdfs_table (a_col string, b_col string, c_col string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
LOCATION "hdfs:///blahblah";
CREATE EXTERNAL TABLE dynamodb_table (c1 string, c2 string, c3 string)
STORED BY 'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler'
TBLPROPERTIES ("dynamodb.table.name" = "output_table",
"dynamodb.column.mapping" = "c1:id,c2:timestamp,c3:data");
INSERT OVERWRITE TABLE dynamodb_table SELECT * FROM hdfs_table;
基本的に4番目の列である範囲キーを使用して、新しい出力テーブルを設定しました。このスクリプトにパラメーターとして渡される値に範囲キーを設定したいと思います。SQL ALTER
andに似た何かをしたいと思いますSET DEFAULT
。任意のポインタをいただければ幸いです。