“mapr”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

165 参照

docker - Docker - ホストから mapr UI にアクセス

CentOS マシンに docker をインストールしました。今、私はその上で MapR サンドボックスを実行しようとしています。開始後、私はこれを取得します：

しかし、CentOS マシンと同じネットワーク内の Windows マシンからこの URL にアクセスできません。

docker mapr

2015-04-15T09:34:13.123

0 投票する

1 に答える

710 参照

hadoop - 単一ノードクラスタで MapR のインストールが失敗する

単一ノードクラスタのクイックインストールガイドを参照していました。このために、MaprFS に 20GB のストレージファイルを使用しましたが、インストール中に「ディスクが見つかりません: /maprfs/storagefile」というメッセージが表示されます。

ここに私の設定ファイルがあります。

以下は私が得ているエラーです。

ここで私を助けてください。

ありがとうシャシ

2015-04-16T13:47:39.410

0 投票する

1 に答える

1022 参照

hadoop - Spark で MapFile を作成してアクセスする方法は?

Spark RDD から MapFile を作成しようとしていますが、十分な情報が見つかりません。これまでの私の手順は次のとおりです。

私は、

rdd.saveAsNewAPIHadoopFile(....MapFileOutputFormat.class)

MapFilesソートする必要があるため、例外がスローされました。だから私は次のように変更しました：

rdd.sortByKey().saveAsNewAPIHadoopFile(....MapFileOutputFormat.class)

これは正常に機能し、MapFile が作成されました。したがって、次のステップはファイルにアクセスすることでした。作成されたディレクトリ名を使用すると、ファイルpartsが見つからないと言って失敗しました。Google に戻ると、使用する必要のあるパーツにdataアクセスするために次のことがわかりました。MapFile

素朴に、私はそのビットを無視し、HashPartionerこれでエントリが見つかると期待しましたが、うまくいきませんでした。したがって、私の次のステップは、リーダーをループしてget(..). このソリューションは機能しましたが、ファイルが 128 個のタスクによって作成され、結果として 128 個のファイルが作成されたため、非常に低速でしたpart。

の重要性を調べたHashPartitionerところ、内部的に使用するリーダーを識別するために使用されていることがわかりましたが、Spark は同じパーティショニングロジックを使用していないようです。だから私は次のように変更しました：

rdd.partitionBy(new org.apache.spark.HashPartitioner(128)).sortByKey().saveAsNewAPIHadoopFile(....MapFileOutputFormat.class)

しかし、再び2HashPartionerは一致しませんでした。では、質問の部分...

効率的に結合する方法はありMapFilesますか (これはパーティショニングロジックを無視するため)。
MapFileOutputFormat.getReaders(new Path(file), new Configuration());非常に遅いです。読者をより効率的に識別できますか?
基盤となる DFS として MapR-FS を使用しています。これは同じHashParitioner実装を使用しますか?
再分割を回避する方法はありますか、それともデータをファイル全体でソートする必要がありますか? (パーティション内でソートされるのとは対照的)
例外も発生しています_SUCCESS/data does not exist。このファイルを手動で削除する必要がありますか?

これに関するリンクは大歓迎です。

PS。HashPartitionerエントリがソートされている場合、を使用して正しいを見つけるにはどうすればよい Readerですか? partsこれは、データがHash Partitionedキーでソートされていることを意味します。だから私も試してみrdd.repartiotionAndSortWithinPartitions(new HashPartitioner(280))ましたが、やはり運がありませんでした。

hadoop apache-spark hdfs mapr

2015-04-18T09:08:51.573

0 投票する

1 に答える

696 参照

mapreduce - Hive map-reduce クエリが失敗する

map-reduce ジョブを起動できる最初の Hive クエリを実行しようとしています。「 http://doc.mapr.com/display/MapR/Hive 」に記載されているすべての手順に従いました。

「web_log」テーブルが作成され、データの読み込みがエラーなしで完了しました。しかし、「SELECT web_log. FROM web_log WHERE web_log.url LIKE '%doc'*」を実行しようとすると、次の例外が発生します。

誰かが私を案内してくれませんか。

mapreduce hiveql mapr

2015-04-19T14:55:58.447

0 投票する

4 に答える

4251 参照

scala - Spark シェルエラー: エラー SparkDeploySchedulerBackend: 存在しないエグゼキューターを削除するように求められました 11

mapr Sandbox で spark-shell を起動するたびに、このエラーが発生し続けます

このエラーを解決するのを手伝ってください。

scala apache-spark mapr

2015-04-23T05:23:25.390

0 投票する

2 に答える

632 参照

hadoop - Platfora と Datameer のディストリビューション

Platfora および Datameer 分析ツールのインストールに関心があります。私の疑問は、これらのツールの両方のドキュメントにあります。既存の Hadoop ディストリビューションについては、CDH、HDP、および MapR を含む互換性リストが提供されていることがわかります。しかし、これらを既存のプレーンな Hadoop にインストールしたかったのです。つまり、Apache Hadoop コンポーネントを 1 つずつダウンロードして Hadoop をインストールし、クラスターを準備しました。

この場合、これらのツールは機能しますか?

hadoop analytics cloudera-cdh hortonworks-data-platform mapr

2015-05-13T05:30:28.727

0 投票する

2 に答える

9636 参照

hadoop - MapR-DB と Hbase の違い

私は MapR の初心者ですが、hbase については知っています。Mapr-DB が MapR の NoSQL DB であり、Hbase に似ていることがわかったビデオの 1 つを見ていました。この Hbase に加えて、MapR でも実行できます。MapR-Db と Hbase の間で混乱しています。それらの正確な違いは何ですか?

Mapr-DB をいつ使用し、いつ Hbase を使用するか?

基本的に、MapR の Hbase でバルクロードを行う Java コードが 1 つあります。ここで、Apache hadoop に使用したのと同じコードを使用すると、そのコードはここで機能しますか?

この混乱を避けるために私を助けてください。

hadoop hbase mapr

2015-05-15T07:40:47.310

問題タブ [mapr]

Reference