Hadoop と mapreduce パーティショナーは初めてです。独自のパーティショナーを作成したいのですが、パーティショナーでファイルを読み取る必要があります。私は何度も検索しましたが、分散キャッシュを使用する必要があることがわかりました。Hadoop パーティショナーで分散キャッシュを使用するにはどうすればよいですか? パーティショナーには何を書くべきですか?
public static class CaderPartitioner extends Partitioner<Text,IntWritable> {
@Override
public int getPartition(Text key, IntWritable value, int numReduceTasks) {
return 0;
}
}
ありがとう