0

xdmp:document-insert()のフォレストを選択するために使用されるアルゴリズムと、フォレスト全体のドキュメントの分散に影響を与える要因は何ですか?

xdmp:document-insertがドキュメントを均等に配布していないのがわかります。cts:urisの出力をxdmp:document-assignに渡してから、key=forest-nameおよびvalue=uriscountをマップに入力してみました。

let $ index:= xdmp:document-assign($ uri、$ forests-count)let $ forest-name:= xdmp:forest-name($ forests [$ index])

$ forests-countが低い場合、ドキュメントはさらにフォレスト間でバランスが取れていますが、そうでない場合。森林の割合が高い(〜50)ため、ウリの分布が不均一になっています。

4

1 に答える 1

1

このアルゴリズムは 64 ビット ハッシュを使用するため、50 以上のフォレストに対して十分なアドレス空間があります。数百、おそらく数千のフォレストを持つ展開されたクラスターがあります。私が使用しているクラスターでは、通常、ドキュメント数は平均の 10% 以内です。ほとんどの森林操作はO(log n).

配置は、URI 自体が均一に分散されている場合に最適に機能する傾向があります。たとえば、連続した番号の URI は、さらにまとまる可能性があります。

于 2012-11-02T20:58:05.880 に答える