java - ファイルへのパスに hdfs:// プレフィックスを使用すると、ファイルを開くことができるのはなぜですか?

Question

ページをクロールする Hadoop ジョブを作成しています。私が使用しているライブラリは、クロール中にファイルシステムを使用してクロールデータを保存します。私が使用しているクローラーライブラリは java.io を使用していますが、HDFS とのインターフェイスにはまったく異なるクラスセットを使用する必要があるため、HDFS を使用するにはライブラリを変更する必要があると確信していました。

しかし、同僚が hdfs://localhost/path/to/storage を使用すると、ストレージフォルダーへのパスに対してクローラーが機能し、ファイルシステムに書き込むことができました。なぜこれが機能するのかを理解しようとしています.hdfs://プレフィックス付きのパスをHDFS上のパスに解決する原因となるhadoopベースのjvmに違いはありますか?

score 3 · Accepted Answer

使用している HDFS インターフェイスの種類がわかりません。Hadoop は、汎用ファイルシステムレイヤーを提供します。Hadoop 構成ファイル (HADOOP_HOME/conf/core-site.xml 内、プロパティの名前は「fs.default.name」) で NameNode アドレスを指定しない場合、すべての「hadoop fs ...」コメントはデフォルトでローカルファイルシステムになります。そのため、hadoop の構成がわからない場合は、"hdfs://namenode:port/" をプレフィックスとして含めることをお勧めします。

java - ファイルへのパスに hdfs:// プレフィックスを使用すると、ファイルを開くことができるのはなぜですか?

1 に答える 1

Related

Reference