問題タブ [hfile]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

34 問題

0 投票する

1 に答える

99 参照

hbase - 古い Hfile の行キーへの参照が削除または無効化されるのはいつですか?

hbase は、(行キー RK1 の) レコードの更新を Hfile に書き込みます。ただし、古い Hfile の 1 つには、この行キー RK1 への参照が含まれます。この RK1 へのこの古い参照はいつ、どのように無効になりますか?

行キー RK1 のレコードを含む Hfile があるとします。次に、この RK1 が更新されます。これは、この更新が新しい HFile に書き込まれることを意味します。RK1 への参照を含む古い Hfile を無効にする必要があります。これは Hbase でいつどのように行われますか?

ありがとう。

2015-11-11T06:04:05.767

0 投票する

3 に答える

244 参照

hbase - Mapr-Db の一括読み込みがレデューサー側で失敗する

レデューサーの処理中に次のエラーでバルクロードが失敗しました。m7 テーブルを更新しようとして、M5 クラスターで mapreduce を実行しています。

hbase のバージョンは 0.98.12-mapr-1506 です。

Mapr-Db テーブルは一括読み込みが有効になっています。レデューサーはすべてのデータを処理し、バルクロード時に何らかの方法で失敗します。

助けてください。

hbase bulk-load hfile

2015-12-29T20:24:36.477

0 投票する

1 に答える

941 参照

hbase - hbase NameError: 初期化されていない定数 IS_MOB

テーブルを作成しようとすると、hbase-0.98.18-hadoop2 のユーザーです。

エラーがあります:

しかし、次の行を hbase-site.xml に追加しました。

Hfile バージョン 3 をサポートするため。ただし、問題はまだ存在します。どうすればこの問題を解決できますか?

hbase hfile

2016-05-19T04:14:24.033

0 投票する

1 に答える

1743 参照

hadoop - 大規模なデータセットに対して Spark ジョブを実行できない

S3 の Hive データから読み取り、HFiles を生成する Spark ジョブを作成しました。

このジョブは、1 つの ORC ファイル (約 190 MB) のみを読み取る場合は正常に機能しますが、S3 ディレクトリ全体 (約 400 個の ORC ファイル) を読み取るために使用すると、約 400*190 MB = 76 GB のデータになり、次のようにスローされ続けます。エラー/スタックトレース:

私のクラスターはそれを処理するのに十分な大きさです: (これはすでに検証されています)

40 個のノード、800 GB を超える使用可能なメモリ、320 個の仮想コアがあります。

そして、ここに私のJavaコードがあります:

メインプログラム:

私が試したこと：

Stackoverflowで最も近い投稿を見ました。それから私はこれを設定しまし builder.config("spark.shuffle.blockTransferService", "nio"); たが、まだ運がありません。

どんな助けでも大歓迎です！

hadoop apache-spark amazon-s3 hbase hfile

2017-06-12T03:41:38.033

1 2 3 4 5 6 7 8 9 10

問題タブ [hfile]

hbase - 古い Hfile の行キーへの参照が削除または無効化されるのはいつですか?

hbase - Mapr-Db の一括読み込みがレデューサー側で失敗する

hbase - hbase NameError: 初期化されていない定数 IS_MOB

hadoop - 大規模なデータセットに対して Spark ジョブを実行できない

Reference