0

私はHadoopプログラムを作成していますが、引数を直接Hadoop use args []に渡すことができることを知っています。つまり、現在は次のようになっています。

ToolRunner.run(new Configuration(), new RunDear(), args); 

しかし、引数が多い場合は、以下のような構成ファイルを作成して、Hadoopに渡すことはできますか?このファイルは、ローカルファイルシステムまたはhdfsのどこに配置する必要がありますか?

sample_size 200
input_genotype_file /data/genotypes.txt 
input_phenotype_file /data/phenotypes.txt
output_directory /outout 
mtry 200
ntree 3000
distance 0 (e.g. 0=euclidean, 1=mehalanobis
variable_important 0 (e.g. 0=information gain, 1=permutation)
etc….
4

3 に答える 3

1

conf.addResource(new Path(/ path / to / local / file))を使用できます。これにより、ファイルがすべてのタスクに渡されます。

于 2012-05-28T07:43:42.587 に答える
1

ファイルを分散キャッシュに入れてから、構成内のファイルの名前をタスクに渡すことができます。

于 2012-05-28T07:00:01.417 に答える
0

これらの引数を読み取り、agrs配列に設定して、それを渡すラッパークラスを作成できます。

于 2012-05-27T09:00:08.140 に答える