1

私たちのシミュレーションでは、閉じた曲線 (赤い線) が移動できる基礎となる 2D グリッドがあります。グリッド セルは、中心の位置に基づいて、曲線の内側 (緑) または曲線の外側 (青) として色付けされ、圧力などの状態変数に対してそれぞれ異なる値を持つことができます。ドメイン内の任意のポイントについて、それが内側か外側かを正確に知ることができ、補間によりポイントの特定の状態を得ることができます (つまり、この情報はセル中心のデカルト グリッドを使用するよりも具体的です)。

グリッドの漫画

曲線内の「ピーク」圧力の堅牢な測定値を取得しようとしています (ここで、ピークは、たとえば値の上位 1% の平均である可能性があります)。

現在、セル中心の値の最大値のみを取得していますが、画像でわかるように、曲線が移動するたびに非常に大きな分散が発生する可能性があります。さまざまなオプションを評価しようとしていますが、それらの有効性、特に使用できる統計手法があるかどうかについてはわかりません.

検討したオプション:

  1. N*N*num_of_2D_cellsグリッド全体でポイントのランダム サンプルを取得する
  2. 各 2D セルについて、N*Nポイントのランダム サンプルを取得します
  3. 各 2d セルをN*Nより小さなセルに分割し、それらのセル中心の値を計算します

これらNのメソッドが大きくなると収束するはずですが、2D グリッドは 1e7 セルを超える可能性があります。そのため、計算時間により、サイズの上限が設定されNます。

この種の問題を扱った経験のある人、または扱っている一連の文献を知っている人はいますか?

4

1 に答える 1

0

問題のステートメント (サンプルからベース母集団の上位 1% の平均を知ること) は、予測間隔に関連しているように聞こえます。これに関する特定の質問は、 http://stats.stackexchange.comで尋ねるのが最善だと思います。

圧力値の分布、またはおそらくいくつかの境界を知っていますか?たとえば、距離にあるポイント間の圧力差xが常に 未満であるという意味でy、またはそのようなものですか? これにより、サンプリング アプローチが大幅に簡素化される可能性があります。

提案するオプションに関しては、オプション#3を調整し、四分木を使用して曲線の形状を近似することができます(2Dセルを使用)。次に、 (おおよそ) 曲線内にあるセルから、それらの面積に比例する頻度でランダムにサンプリングできます。そうすることで、曲線内にない領域でサンプルを取得することを回避し (これは無駄な労力になります)、曲線に (ほぼ) 完全に含まれるセルをさらに細分化することも回避できます。最終的に、曲線内から (ほぼ) 偏りのないランダム サンプルが得られ、その上で統計を計算できます。

于 2013-04-16T12:12:03.107 に答える