Hadoopmapreduceを使用してAmazonDynamoDBに保持されているデータを処理する必要があります。
インターネットでDynamoDBのHadoopInputFormatを検索していましたが、見つかりませんでした。Dynamo DBに慣れていないので、DynamoDBとHadoopに関連するトリックがあると思いますか?この入力フォーマットの実装がどこかにある場合は、それを共有していただけますか?
Hadoopmapreduceを使用してAmazonDynamoDBに保持されているデータを処理する必要があります。
インターネットでDynamoDBのHadoopInputFormatを検索していましたが、見つかりませんでした。Dynamo DBに慣れていないので、DynamoDBとHadoopに関連するトリックがあると思いますか?この入力フォーマットの実装がどこかにある場合は、それを共有していただけますか?
多くの検索を行った後、Amazonのライブラリの1つにDynamoDBInputFormatとDynamoDBOutputFormatが見つかりました。
Amazon Elastic Map Reduceには、dynamoDBの入力および出力形式を含むhive-bigbird-handlerと呼ばれるライブラリがあります。完全なクラス名は、org.apache.hadoop.hive.dynamodb.write.DynamoDBOutputFormatおよびorg.apache.hadoop.hive.dynamodb.read.DynamoDBInputFormatです。
これらのクラスがコミュニティに役立つことを願っています。
MapReduce で直接使用できる InputFormat が見つかりませんでした。ただし、記事AWS HowTo: Using Amazon Elastic MapReduce with DynamoDB (Guest Post)で、Hive を使用して MarReduce ジョブを実行します。