“hadoop-partitioning”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

434 参照

java - Hadoop の分散キャッシュファイルプログラムが出力を生成しない

ファイルから特許データを読み取り、他の国がその特許を引用しているかどうかを確認することを目的とする単純なプログラムを設計しようとして'Hadoop in Action'い'chuck Lam'ますadvanced map/reduce programming。

セットアップした Hadoop ディストリビューションはで、を使用Local Nodeしてでプログラムを実行しています。Windows environmentcygwin

http://www.nber.org/patents/これは、ファイル :apat63_99.txtおよびをダウンロードした URLですcite75_99.txt。

'apat63_99.txt'分散キャッシュファイルとして使用しており、コマンドラインパラメーターから渡し'cite75_99.txt'たフォルダー内にあります。input

問題は、プログラムが出力を生成していないことです。表示されている出力ファイルにはデータが含まれていません。

マッパーフェーズとリデューサーフェーズの出力を試しましたが、どちらも空白です。

このタスクのために開発したコードは次のとおりです。

ツールはEclipseで、Hadoop's version使用しているものはです1.2.1。

これらは、ジョブを実行するためのコマンドラインパラメーターです。

これは、プログラムの実行中に生成されるトレースです。

重要な情報を見逃した場合に備えて、どこが間違っているのかお知らせください。

感謝と敬意

2014-06-22T07:27:37.680

0 投票する

0 に答える

95 参照

java - Hadoop パーティショニングのマップタスク

ラインリーダーを使用して入力を分割した Hadoop Map Reduce ジョブがあります。

マップ入力レコード = 10。

ラインリーダー分割を識別するLongWritableキーに基づいてマップタスク出力を分割することは可能ですか?

そうでない場合 - 各マップタスクの出力を分割する別の方法はありますか?

java hadoop mapreduce hadoop-partitioning

2014-06-26T16:17:34.200

0 投票する

0 に答える

101 参照

java - hadoop-env.sh に関する質問

私はエラーに直面しています:Javaヒープスペースとエラー:GCオーバーヘッド制限を超えました

それで、hadoop-env.sh を調べ始めました。

これまでのところ私が理解していることです。間違っている場合は修正してください。

これにより、データノードで datanode デーモンと tasktracker デーモンが呼び出され、それぞれに 7GB のメモリが割り当てられます (datanode(7GB)+ tasktracker(7GB) = 14GB)。

と

したがって、これは 1GB のメモリで 9 つの子 JVM を呼び出すので、合計で 9GB になります。

しかし、tasktracker は 7GB のメモリで呼び出されるため、競合が発生します。tasktracker と tasktracker によって呼び出される子 JVMS の最大メモリは 7GB ですが、9G を消費しています。

ヒープ領域エラーが発生しましたが、私の計算は正しいですか?

java hadoop hadoop-streaming hadoop-partitioning hadoop2

2014-06-27T05:31:02.047

0 投票する

1 に答える

520 参照

hadoop - Map-reduce ジョブでキーのハッシュコードを既に実装している場合、customPartitioner は役に立ちますか?

実装せずにカスタムkeyクラスを作成しています。hashCode

ジョブを実行しmap-reduceますが、ジョブの構成中にpartitoner次のようなクラスを設定します。

partitioner実装は次のとおりです。

map-reduceジョブを実行し、出力を保存します。

job.setPartitionerClass(TaggedJoiningPartitioner.class);ここで、上記のジョブ設定でコメントアウトします。

hashCode()次のようなカスタムクラスに実装しました：

ここで、ジョブを再度実行します (注: セットはありませんpartitoner)。map-reduce ジョブの後、前の出力を比較します。どちらもまったく同じです。

だから私の質問は：

hadoop mapreduce hashcode hadoop-partitioning

2014-07-16T19:13:10.513

0 投票する

4 に答える

9387 参照

hadoop - Hive で「CREATE TABLE AS SELECT .....」を使用して作成されたテーブルをクラスター化/バケット化できますか?

Hiveでテーブルを作成しようとしています

この構文は失敗していますが、この組み合わせステートメントを実行できるかどうかはわかりません。何か案は？

hadoop hive hiveql bucket hadoop-partitioning

2014-07-22T20:41:13.947

0 投票する

1 に答える

533 参照

hadoop - 通話詳細レコードのデータを処理できるように、hadoop を実装する必要がありますか?

HDFS、Datanode、namenode、および hbase を構成しました。CDR csv ファイルを HDFS に保存しました。では、どうすればそれを Hbase にマップして、処理できるように準備できるのでしょうか?

hadoop hadoop-streaming hadoop2 hadoop-plugins hadoop-partitioning

2014-07-23T15:22:04.460

0 投票する

1 に答える

57 参照

hadoop - hbase でのクラッシュ後にプライマリにデータを保存する方法

私はHBaseの初心者です。マスターリージョンとセカンダリリージョンがあるとします。

いくつかの外的要因により、プライマリリージョンが数時間ダウンしたと仮定してください。プライマリサーバーが正常な状態に戻った場合。

プライマリリージョンのオフライン中に読み込まれたデータの一部が失われた可能性があります。したがって、欠落したジョブをロードするためにプライマリサーバーを同期する方法は次のとおりです。

前もって感謝します！！

hadoop hbase hadoop-partitioning

2014-07-28T15:48:11.783

0 投票する

1 に答える

183 参照

hadoop - Linux 64 ビットマシンに hadoop-2.2.0 をインストールする際の問題

このリンクを使用して、Hadoop バージョン - 2.2.0 (単一ノードクラスター) を ubuntu 12.04 (64 ビットマシン) にインストールしようとしました

http://bigdatahandler.com/hadoop-hdfs/installing-single-node-hadoop-2-2-0-on-ubuntu/

次のコマンドを使用してnamenodeを介してhdfsファイルシステムをフォーマットしている間

私がそれをしているときに、次の問題が発生します。

14/08/07 10:38:39 FATAL namenode.NameNode: namenode 結合の例外 java.lang.RuntimeException: org.xml.sax.SAXParseException; systemId: ファイル:/usr/local/hadoop/etc/hadoop/mapred-site.xml; 行番号: 27; 列番号: 1; 末尾のセクションにコンテンツを含めることはできません。

次の問題を解決するために何をする必要がありますか?

Mapred-site.xml:

hadoop hadoop-streaming hadoop2 hadoop-plugins hadoop-partitioning

2014-08-07T05:23:42.253

問題タブ [hadoop-partitioning]

Reference