3

7次元空間に約10 ^ 4ポイントがあります。特定のアプリケーションでは、特定の範囲内にあるすべてのポイントを見つけるために、この入力に対して ~10^6 の範囲クエリを作成する必要があります。このアプリケーションでは、すべてのクエリが同じ範囲サイズを使用しています。この問題に適したデータ構造は何ですか?

kd-tree が適しているように見えますが、7 次元で出力サイズが小さい場合、クエリの時間の複雑さはほぼ直線的です。もう 1 つの解決策はレンジ ツリーですが、このアプリケーションでは少数の入力に対して構成するには複雑すぎるようです。また、範囲が一定のサイズであるという事実を有利に利用しているこれらの構造は見当たりません。たとえば、これが 1D の問題である場合、クエリはすべて、たとえばサイズ 10 の範囲内にあるポイントを、数直線に沿ったさまざまな場所で求めることになります。

4

1 に答える 1

0

まあ、これは遅い答えです。今役に立つかどうかはわかりません。高さ固定 FQT (FHFQT または FHQT) [ http://users.dcc.uchile.cl/~rbaeza/ftp/fqtrees.ps.gz]または固定クエリ配列 (FQA) [ http://www.dcc .uchile.cl/~gnavarro/ps/mtap01.pdf] . これらの構造は、その種の類似性検索でうまく機能します。それに加えて、良い結果を得るには、インクリメンタルのような優れたピボット選択方法を使用する必要があります。ユークリッド距離を使用しており、距離ヒストグラムはガウス分布であると想定しています。私の英語でごめんなさい...

于 2016-08-31T02:34:54.500 に答える