ここに省略されたデータセットがあります:
SNP chr BP log10 PPA
rs10068 17 56555 1.16303 0.030
rs10032 17 56561 26.364 0.975
rs10354 17 34951 4.3212 0.626
rs10043 17 20491 0.00097 0.006
rs10457 17 69572 -0.38403 0.014
rs10465 17 69872 8.19547 0.927
ここで、PPAは関連の事後確率です。私はいくつかの高いlog10値(> 6)を持っているので、これらの領域の周りの信頼区間を決定して、それらがどれだけ大きいか小さいかを自信を持って決定したいと思います。
これを行うには、まず、log10> 6のSNPを特定します。これは、サブセットを使用すると十分に単純です。
newdata <- subset(data, log10 > 6)
ただし、BP 500 +/-リードSNPのBP(log10> 6)を使用して、これらのリードSNPに物理的に近いSNPもこのサブセットに含めたいと思います。ここが私が進むための最良の方法がわからないところです。これは私が取り組むことができるものですか、subset
それとも最初に元のデータでこれらのリードSNPを特定し、次にそこからサブセット化する必要がありますか?
これらの領域を分離したら、先に進むことができます。
任意の提案をいただければ幸いです。