2

大きなテーブルに他の 3 つのテーブルを結合しています。

A = (f1,f2) RIGHT OUTER で小さいテーブルを結合し、(f1,f2) で MassiveTable を結合します。

B = (f3) RIGHT OUTER によって AnotherSmall に参加し、A によって (f3) によって結合します。

C = (f4) によって AnotherSmall に参加し、B によって (f4) によって参加します。

小さなテーブルはメモリに収まらない可能性がありますが、これにより10億のオブジェクトが3回読み取られ、時間がかかります。再読み取りを回避してプロセスをより効率的にする方法があるかどうか疑問に思っていましたか?

前もって感謝します。

4

1 に答える 1

0

HBase で大きなテーブルを 3 つの列ファミリ、つまり、分割f1f2、 from f3、および fromを持つように設計するとf4、不要な読み取りを回避できるはずです。

また、考えてみると、レコードの別の部分を読み直すのではなく、最初にf1f2、次にf3と最後にを読みf4ます。

于 2013-03-01T16:32:18.733 に答える