Hadoop ジョブを実行しています。4 つのタスクを除くすべてが完了しました。これらのチャンクを処理するのになぜこれほど長い時間がかかるのか、私は考えています。私の推測では、これらの入力レコードを私の仕事で処理するのは「難しい」と思います。ローカルでテストするには、それらの入力レコードを取得したいと思います。どうやってこれを行うのですか?
タスクのステータス列には hdfs://10.4.94.75:8020/user/someuser/myfilename:154260+3 と表示されます
しかし、それはどういう意味ですか?