1

私が抱えている問題は、hadoop jar コマンドには入力パスが必要ですが、MapReduce ジョブはデータベースから入力を取得するため、入力ディレクトリを必要としない/持っていないことです。JobConf の入力フォーマットを DBInputFormat に設定しましたが、ジョブを妨害するときにこれをどのように示すのですか?

//Here is the command
hadoop jar <my-jar> <hdfs input> <hdfs output>

出力フォルダーはありますが、入力フォルダーは必要ありません。これを回避する方法はありますか?DB データをフォルダーにプルし、それを MapReduce ジョブで使用する 2 つ目のプログラムを作成する必要がありますか?

4

1 に答える 1