2

これが相互検証されるかどうかはわかりませんが、わかります。基本的に、最近、機器からデータを取得しました (0 から 630 までの化合物の質量)。以下に示すように、ヒストグラムをプロットする前に、0.025 ビンにビン化しました。 ここに画像の説明を入力

周波数が高く、バックグラウンド ノイズに対して際立っているビンを特定したいと考えています (軸上で右から左に移動すると、バックグラウンド ノイズが増加します)。ほとんどぼやけて黒い塊になったポイントの上に曲線を描き、その曲線の上にあるビンを選択してさらに調査することを想像してみてください。それが私がやろうとしていることです。カーネル密度プロットをプロットして、それをヒストグラムの上に重ねて、それを使用してプロットの上に存在するポイントを特定できるかどうかを確認しました。ただし、密度が低すぎる値であるため、密度プロットはこれでまったく前進しません (2 番目のプロットを参照)。この問題を解決するにはどうすればよいかについて、誰かに推奨事項はありますか? 青い線はオーバーレイされた密度関数プロットを表し、赤い線は理想的なソリューションを表します (これを R で自動化する方法が必要です) ここに画像の説明を入力

以下のデータは私のデータセットの一部にすぎないため、実際には私のプロット (約 300,000 ポイントを含む) を適切に表したものではありません。また、ビンのサイズが非常に小さい (0.025) ため、データが膨大に広がっています (合計で 25,000 あります)。またはそうビン)。

df <- read.table(header = TRUE, text = "
   values
1 323.881306
2   1.003373
3  14.982121
4  27.995091
5  28.998639
6  95.983138
7  2.0117459
8  1.9095478
9  1.0072853
10  0.9038475
11  0.0055748
12  7.0964916
13  8.0725191
14  9.0765316
15  14.0102531
16  15.0137390
17  19.7887675
18  25.1072689
19  25.8338140
20  30.0151683
21  34.0635308
22  42.0393751
23  42.0504938
")
bin <- seq(0, 324, by = 0.025)
hist(df$values, breaks = bin, prob=TRUE, col = "grey")
lines(density(df$values), col = "blue")
4

1 に答える 1