クエリ オプティマイザは通常、データ分散の概要を使用して、クエリ処理中に生成される中間テーブルのサイズを見積もります。このような一般的な要約スキームの 1 つはヒストグラムです。これにより、入力範囲がバケットに分割され、各バケットに含まれるタプルの数の累積カウントが維持されます。バケット内の分布は、推定のために均一であると想定されます。
R
次の図は、ドメイン を持つ離散属性 aのリレーションのヒストグラムの 1 つを示しています[1..10]
。
Bucket 1: range = [1..2] Cumulative tuple count = 6
Bucket 2: range = [3..8] Cumulative tuple count = 30
Bucket 3: range = [9..10] Cumulative tuple count = 10
自己結合操作の推定サイズ R x R
A) 46
B) 218
C) 248
D) 1,036
E) 5,672
ソリューションで与えられた答え:B
答えはどのように計算されますか?