“mapr”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

292 参照

linux - unix utils または nmon で Hadoop fs を使用してディスク情報を取得するにはどうすればよいですか?

mfs ( hadoop fs ベース) とdf、dfisk、およびnmonログファイルを使用してファイルシステムから情報を取得するスクリプトを使用して maprをインストールしました。

ここで、mapr を hadoop fs として使用するデバイス/dev/sdb1から情報を取得したいと考えています。私は次のようなものを使用できることを知っています

でも、他に慣れる方法や合計サイズなどがあるといいのですが。

/dev/sdb1 をマウントできません。何らかのプロセスで使用されているためです。また、パーティションが既にマウントされている可能性のあるパスが見つかりません。

2015-03-16T10:46:00.300

0 投票する

1 に答える

491 参照

java - java.lang.IllegalArgumentException: default という名前のキューがありません

データを豚にロードし、同じデータをコンソールにダンプしようとしています。次のコマンドを使用して、Cloudera サンドボックスでエラーなしで実行しました。

sampledata ファイル内のすべてのデータをダンプします。

次のコマンドを使用して、MapR クラスターで同じことを試みます。

次のエラーが発生します。

助けてください。

前もって感謝します。

java hadoop apache-pig mapr

2015-03-23T15:04:08.590

0 投票する

2 に答える

594 参照

apache - 分散モードの Apache Drill

SQL-on-semi 構造化データを実行するという要件のドリルを調査し始めました。Zookeeper を使用して 4 ノードのドリルクラスタをセットアップしました。それが実際にどのように機能するかについていくつか質問がありますが、

dfs (ローカルファイルシステム) を使用して分散モードで Drill を実行すると、ノードの 1 つ (たとえば n1) に 1GB の Json ファイルがあります。任意のノード (n1、n2、n3、n4) から sqlline を起動してクエリを実行できます。n1 にのみ日付があります。私の質問は

を。クエリはすべてのノードで実行されていますか? つまり、Drill はデータを他のノード n2、n3n4 に分散することによって、クエリの実行を並列化しますか?

b. NO の場合、すべてのノード n2、n3、n4 に同じファイルをコピーすることで、Drill の MPP アーキテクチャを活用できますか?

apache hive mapr apache-drill

2015-03-31T09:35:39.393

0 投票する

1 に答える

246 参照

file - Hadoop 書き込みファイルと分散キャッシュへの配置

Hadoop job.properties のコンテンツに基づいて動的ファイルを作成し、それを分散キャッシュに配置する必要があります。

ファイルを作成すると、「/tmp」のパスで作成されていることがわかります。

シンボリック名を作成し、キャッシュ内のこのファイルを参照します。さて、Dis. キャッシュにアクセスできません。java.io.FileNotFoundException: 要求されたファイル /tmp/myfile6425152127496245866.txt が存在しません。

ファイルの作成中にもパスを指定し、ファイルへのアクセス/読み取り中にそのパスを使用する必要があるかどうか教えてください。

ジョブが実行されるまでファイルを利用できるようにするだけです。

file cascading mapr

2015-03-31T16:53:34.823

0 投票する

1 に答える

359 参照

java - Spring-XD と hdfs シンクを maprfs で動作させる

これは、公式にはまだサポートされていない maprfs と連携する spring-xd リリース 1.0.1 に関する質問です。それでも私はそれを機能させたいと思っています。

これが私たちがしたことです：

1) パラメータを受け入れるように xd-shell と xd-worker と xd-singlenode シェルスクリプトを調整しました。--hadoopDistro mapr

2) ライブラリを新しいディレクトリ $XD_HOME/lib/mapr に追加しました

3) とを実行bin/xd-singlenode --hadoopDistro maprしshell/bin/xd-shell --hadoopDistro maprます。

を介してストリームを作成およびデプロイするとstream create foo --definition "time | hdfs" --deploy、データは maprfs のファイル tmp/xd/foo/foo-1.txt.tmp に書き込まれます。ただし、ストリームをアンデプロイすると、次の例外が表示されます。

機能を見てみましたOutputStoreObjectSupport.renameFile()。hdfs 上のファイルが完成すると、このメソッドはファイル /xd/foo/foo-1.txt.tmp の名前を xd/foo/foo1.txt に変更しようとします。これは関連するコードです:

対象のファイルが hdfs 上に存在しない場合、maprfs を呼び出すと例外がスローされるようfs.delete(toPath, false)です。ただし、この場合に例外をスローしても意味がありません。他のファイルシステムの実装では動作が異なると思いますが、これはまだ確認する必要がある点です。残念ながら、MapRFileSystem.java のソースが見つかりません。これはクローズドソースですか？これは、問題をよりよく理解するのに役立ちます。spring-xd から maprfs に書き込んだ経験のある人はいますか? または、spring-data-hadoop を使用して maprfs のファイルの名前を変更しますか?

編集

簡単なテストケース (以下を参照) を使用して、Spring XD 以外で問題を再現することができました。この例外は、inWritingSuffix または inWritingPrefix が設定されている場合にのみスローされることに注意してください。そうしないと、spring-hadoop はファイルの名前を変更しようとしません。したがって、これはまだ私にとっては不十分な回避策です。inWritingPrefixes と inWritingSuffixes の使用を控えてください。

java spring hadoop mapr spring-data-hadoop

2015-04-09T19:46:12.353

問題タブ [mapr]

linux - unix utils または nmon で Hadoop fs を使用してディスク情報を取得するにはどうすればよいですか?

java - java.lang.IllegalArgumentException: default という名前のキューがありません

apache - 分散モードの Apache Drill

file - Hadoop 書き込みファイルと分散キャッシュへの配置

java - Spring-XD と hdfs シンクを maprfs で動作させる

編集

Reference