0

PLINKを使用して処理されたSNPのファイルがあります。私は数千のSNPのリストを持っています。ファイルでは、NA、0、1、または2のいずれかが割り当てられています。NAを持つSNPのリストを削除したいのですが、それらは単型です。問題は、ファイルに数千のSNPがすべて順番にリストされ、その後、スペースで区切られた1行にそれぞれの値がリストされることです。手動検査では、どの値がどのSNPに対応するかを確認するのは非常に困難です。

PLINKを使用してファイルから一塩基多型SNPを削除する簡単な方法はありますか?それとも、これはPythonを使用して行うのが最適ですか?

4

2 に答える 2

1

まだ見つけていない場合は、 を使用して単形 SNP を削除できますPLINK --maf

データセット内の単形 SNP を削除します (MAF = 0.0 のもの) http://www.shapeit.fr/pages/pedmap.html

于 2012-09-02T16:29:30.470 に答える