これが相互検証されるかどうかはわかりませんが、わかります。基本的に、最近、機器からデータを取得しました (0 から 630 までの化合物の質量)。以下に示すように、ヒストグラムをプロットする前に、0.025 ビンにビン化しました。
周波数が高く、バックグラウンド ノイズに対して際立っているビンを特定したいと考えています (軸上で右から左に移動すると、バックグラウンド ノイズが増加します)。ほとんどぼやけて黒い塊になったポイントの上に曲線を描き、その曲線の上にあるビンを選択してさらに調査することを想像してみてください。それが私がやろうとしていることです。カーネル密度プロットをプロットして、それをヒストグラムの上に重ねて、それを使用してプロットの上に存在するポイントを特定できるかどうかを確認しました。ただし、密度が低すぎる値であるため、密度プロットはこれでまったく前進しません (2 番目のプロットを参照)。この問題を解決するにはどうすればよいかについて、誰かに推奨事項はありますか? 青い線はオーバーレイされた密度関数プロットを表し、赤い線は理想的なソリューションを表します (これを R で自動化する方法が必要です)
以下のデータは私のデータセットの一部にすぎないため、実際には私のプロット (約 300,000 ポイントを含む) を適切に表したものではありません。また、ビンのサイズが非常に小さい (0.025) ため、データが膨大に広がっています (合計で 25,000 あります)。またはそうビン)。
df <- read.table(header = TRUE, text = "
values
1 323.881306
2 1.003373
3 14.982121
4 27.995091
5 28.998639
6 95.983138
7 2.0117459
8 1.9095478
9 1.0072853
10 0.9038475
11 0.0055748
12 7.0964916
13 8.0725191
14 9.0765316
15 14.0102531
16 15.0137390
17 19.7887675
18 25.1072689
19 25.8338140
20 30.0151683
21 34.0635308
22 42.0393751
23 42.0504938
")
bin <- seq(0, 324, by = 0.025)
hist(df$values, breaks = bin, prob=TRUE, col = "grey")
lines(density(df$values), col = "blue")