configuration - Hadoop: HDFS からのマップ/リデュース

Question

私が間違っているかもしれませんが、Apache Hadoop で見たすべての (?) 例は、ローカルファイルシステムに格納されたファイルを入力として受け取ります (例: org.apache.hadoop.examples.Grep)。

Hadoop ファイルシステム (HDFS) にデータを読み込んで保存する方法はありますか? たとえば、「stored.xls」という名前のタブ区切りファイルを HDFS に配置しhadoop-0.19.1/bin/hadoop dfs -put ~/local.xls stored.xlsます。それを読み取るように JobConf をどのように設定すればよいですか?

ありがとう。

score 1 · Accepted Answer

JobConf conf = new JobConf（getConf（）、...）;
..。
FileInputFormat.setInputPaths（conf、new Path（ "stored.xls"））
..。
JobClient.runJob（conf）;
..。

setInputPathsがそれを行います。

score 1 · Accepted Answer

Pierre さん、Hadoop のデフォルト設定は、分散モードではなくローカルモードで実行することです。hadoop-site.xml の一部の構成を変更するだけでよいでしょう。hdfs://youraddress:yourport. fs.default.name の設定を確認してください。詳細については、Michael Noll のブログのセットアップヘルプも参照してください。

score 1 · Accepted Answer

FileInputFormat.setInputPaths(conf, new Path("hdfs://hostname:port/user/me/stored.xls"));

これで十分です

configuration - Hadoop: HDFS からのマップ/リデュース

3 に答える 3

Related

Reference