Hadoop を使い始めたばかりで、ファイルではない他の入力ソースを使用する方法を理解するのに苦労しています。つまり、AWS SimpleDB からすべての行を読み取るか、別のシステムの REST API からすべてのレコードを読み取ります。オンラインのすべてのものは、ファイルまたはいくつかの選択されたデータベースの処理方法のみを示しています。
InputFormat の API は非常に複雑に見えるので、Amazon の Elastic MapReduce (Hadoop ベース) を使用して MapReduced できる、ファイル以外のデータ ソースからデータを読み込む最も簡単な方法を見つけようとしています。コードの記述にはJAVAを使用しています。
ありがとう!