分散キャッシュを使用して、マッパーがデータにアクセスできるようにしたいと考えています。主に、私はコマンドを使用しています
DistributedCache.addCacheFile(new URI("/user/peter/cacheFile/testCache1"), conf);
/user/peter/cacheFile/testCache1 は hdfs に存在するファイルです
次に、セットアップ関数は次のようになります。
public void setup(Context context) throws IOException, InterruptedException{
Configuration conf = context.getConfiguration();
Path[] localFiles = DistributedCache.getLocalCacheFiles(conf);
//etc
}
ただし、この localFiles 配列は常に null です。
最初はテスト用に単一ホスト クラスターで実行していましたが、これにより分散キャッシュが機能しなくなると読みました。擬似分散で試しましたが、それもうまくいきませんでした
Hadoop 1.0.3 を使用しています
ありがとうピーター