PLINKを使用して処理されたSNPのファイルがあります。私は数千のSNPのリストを持っています。ファイルでは、NA、0、1、または2のいずれかが割り当てられています。NAを持つSNPのリストを削除したいのですが、それらは単型です。問題は、ファイルに数千のSNPがすべて順番にリストされ、その後、スペースで区切られた1行にそれぞれの値がリストされることです。手動検査では、どの値がどのSNPに対応するかを確認するのは非常に困難です。
PLINKを使用してファイルから一塩基多型SNPを削除する簡単な方法はありますか?それとも、これはPythonを使用して行うのが最適ですか?