3 つの異なる歩行速度のデータを分析しています。グループ/速度ごとに、「角度」と呼ばれる特定の値を決定しています。各グループのサンプル サイズは異なります。したがって、マルチモーダル分布を比較する必要があり、以下を統計的にテストしたいと思います。
- 各グループ内の 3 つのモード (ピーク) に有意差があります。
- 3 つのグループすべての同じモード間に有意差はありません (他の 2 つのモードと比較)。
分布を以下に示します。各グループの 3 つのモードが互いに相対的にほぼ同じ値で表示されることが注目に値します。
私はこれで立ち往生しています。KDE を試してみたところ、予想される 3 つのクラスターが得られました。違いを証明する方法がわかりません。Kruskal-Wallis ノンパラメトリック検定も試してみましたが (サンプル サイズが異なる場合)、結果はグループ間で有意な差を示しており、分布は統計的に異なるとは思いません (上記の 2. ポイント)。
もう 1 つの問題は、角度が 0 から 360 であるため、これが循環問題であることです。そのため、これがメソッドを変更するかどうかはわかりません (この問題に対処するためにデータを前処理しました)。
助けていただけますか?
私の実際のデータははるかに大きく、ここにコピーできないことに注意してください。そのため、以下におもちゃの例を示します(赤いバイオリンのプロットは実際のデータからのものです)。
structure(list(speed = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), .Label = c("04ms",
"1ms", "2ms"), class = "factor"), angle = structure(c(1L, 16L,
26L, 27L, 4L, 5L, 6L, 17L, 18L, 19L, 28L, 29L, 30L, 2L, 8L, 9L,
12L, 11L, 10L, 22L, 18L, 20L, 28L, 29L, 31L, 15L, 3L, 9L, 7L,
14L, 13L, 14L, 25L, 21L, 22L, 23L, 24L), .Label = c("1", "11",
"12", "120", "121", "123", "125", "13", "130", "132", "133",
"135", "142", "143", "18", "2", "250", "251", "252", "255", "256",
"260", "261", "262", "270", "3", "4", "5", "6", "7", "8"), class = "factor")), class = "data.frame", row.names = c(NA,
-37L))