0

私はいくつか掘り下げましたが、ラテンハイパーキューブサンプリングの概念にはまだ非常に慣れていません。パッケージを使用するこのを見つけましたlhs

set.seed(1)
randomLHS(5,2)

           [,1]       [,2]
[1,] 0.84119491 0.89953985
[2,] 0.03531135 0.74352370
[3,] 0.33740457 0.59838122
[4,] 0.47682074 0.07600704
[5,] 0.75396828 0.35548904

私の理解では、結果のマトリックスのエントリは、2 つの連続変数の組み合わせを決定するために使用される 5 つの点の座標です。

5 つのカテゴリ変数を使用してシミュレーションを実行しようとしています。変数あたりのレベル数は 2 ~ 5 です。これにより、2 x 3 x 4 x 2 x 5 = 240 のシナリオが生成されます。できるだけ小さくしたいのでラテンハイパーキューブを使おうと思っていたのですが、どうしようか迷っています。どんなアイデアでも大歓迎です!

また、ラテン ハイパーキューブ サンプリングの結果を分析する方法を説明している優れたリソースをご存知ですか?

4

1 に答える 1

3

次の理由から、計画点が 240 の完全実施要因計画に固執することをお勧めします。

  1. まったく、これがコンピューターの目的です。退屈な計算タスクを自動化するためです。240 のデザイン ポイントは何でもありません。コンピューターでこれを行っているのです。因子ごとに 1 つのループでレベルを反復するネストされたループを使用して、プロセスを簡単に自動化できます。複製のための最も内側のループを忘れないでください。各シミュレーションに 1 ~ 2 分以上かかる場合は、複数のコアまたは複数のマシンに分割してください。私の学生の 1 人は最近、修士論文の仕事のためにこれを行い、週末に 100 万回以上のシミュレートされた実験を実行することができました。

  2. 連続因子では、通常、応答曲面がある程度滑らかであると仮定し、回帰に基づいて隣接する計画点間の応答を推測/予測します。カテゴリデータでは、除外された因子の組み合わせに対して推論は有効ではなく、交互作用が支配的な効果である可能性が非常に高くなります。完全な階乗を行わない限り、省略した組み合わせが最も重要なものである場合もそうでない場合もありますが、ポイントは、そこをサンプリングしなかったかどうかは決してわからないということです。

一般に、回帰、ロジスティック回帰、ANOVA、パーティション ツリーなど、他の種類のサンプリングを行う場合と同じ分析ツールを使用します...カテゴリカル ファクターについては、パーティション ツリーのファンです。

于 2015-07-03T16:36:56.230 に答える