私は、さまざまな集団からの遺伝子型情報を含む膨大なデータ セットを持っています。データを人口順に並べ替えたいのですが、方法がわかりません。
「pedigree_dhl」でソートしたいと思います。次のコードを使用していましたが、エラー メッセージが表示され続けました。
newdata <- project[pedigree_dhl == CCB133$*1, ]
私の問題は、「pedigree-dhl」に個々の遺伝子型のすべての名前が含まれていることです。「pedigree-dhl」列の最初の 7 文字のみが母集団名です。この例では、CCB133 です。CCB133 を含むすべての列のデータを抽出したいことを R に伝えるにはどうすればよいですか?
Allele1 Allele2 SNP_name gs_entry pedigree_dhl
1 T T ZM011407_0151 656 CCB133$*1
2 T T ZM009374_0354 656 CCB133$*1
3 C C ZM003499_0591 656 CCB133$*1
4 A A ZM003898_0594 656 CCB133$*1
5 C C ZM004887_0313 656 CCB133$*1
6 G G ZM000583_1096 656 CCB133$*1