2

Windows 8システムのUbuntu 14.04 VMHadoop 2.4を正常に構成しました。Hadoop のインストールは問題なく動作しており、Windows ブラウザから Namenode を表示することもできます。以下の添付画像:

ここに画像の説明を入力

したがって、私のホスト名は : ubuntu および hdfs ポート : 9000 です (間違っている場合は修正してください)。

Core-site.xml :

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://ubuntu:9000</value>
</property>

問題は、Pentaho データ統合ツールから HDFS に接続しているときに発生します。以下の添付画像。 PDI バージョン: 4.4.0 使用する手順: Hadoop コピー ファイル

ここに画像の説明を入力

PDI を使用して HDFS に接続する方法を教えてください。これにはjarをインストールまたは更新する必要がありますか?? さらに情報が必要な場合はお知らせください。

4

1 に答える 1

3

PDI 4.4 afaik は Hadoop 2.4 をサポートしていません。いずれにせよ、特定の Hadoop 構成を使用するために設定する必要があるファイル内のプロパティがあります (フォーラムなどで「シム」と呼ばれる「Hadoop 構成」が表示される場合があります)。data-integration/plugins/pentaho-big-data-plugin/plugin.properties ファイルには、active.hadoop.configuration というプロパティがあり、デフォルトでは、Apache Hadoop 0.20 を参照する「hadoop-20」に設定されています。 ×分布。Pentaho に付属する「最新」のディストリビューションに設定するか、私のブログ投稿で説明されているように独自の shim を作成する必要があります。

http://funpdi.blogspot.com/2013/03/pentaho-data-integration-44-and-hadoop.html

PDI の今後のバージョン (5.2+) は、Hadoop 2.4+ を含むベンダー ディストリビューションをサポートするため、PDI マーケットプレイスと pentaho.com に注目してください :)

于 2014-07-31T02:37:54.283 に答える