こんにちは… R への加重データの入力に関して非常に基本的な質問があります。現在、次のようなデータを処理する必要があります (主に曲線フィッティングの目的で)。
> head(mydata, 10)
v sf
1 0.3003434 3.933106
2 0.3027852 5.947432
3 0.3052270 9.832596
4 0.3076688 12.927439
5 0.3101106 14.197519
6 0.3125525 13.572904
7 0.3149943 11.691078
8 0.3174361 9.543095
9 0.3198779 8.048558
10 0.3223197 7.660252
最初の列はデータ (増加と等距離) で、2 番目の列は頻度 (重み) です。現在、これらの重みの合計は 1 になりませんが、簡単に修正できます。
今、R で重み付けされたデータを検索し、最も近いものを見つけたのは、調査パッケージと svydesign() コマンドを使用したものでしたが、それは本当に難しいのでしょうか?
知識不足を回避するために私がしたこと、そしてそれが Kolmogorov_Smirnov テスト (詳細は以下) で問題を引き起こしたのは次のとおりです。
> y <- with(mydata, c(rep(v, times=floor(10*sf))))
これは、対応する重みに比例して最初の列の要素を繰り返します (10 倍して整数を取得します)。しかし、問題は、コルモゴロフ-スミルノフ適合度検定を実行すると、データに関係があるため p 値を計算できないという警告が表示されることです。
質問: カーブ フィッティングの目的で、データを元の形式 (つまり、度数または確率表) で入力して処理するにはどうすればよいですか? ありがとう。