R に大きなデータ フレーム (570 行 x 200000 列) があります。PLINK に詳しい方のために、GWAS 分析用の PED ファイルを作成しようとしています。Plink では、欠落している各文字をゼロでコーディングする必要があります。非欠損値は、「A」、「T」、「C」、または「G」です。
たとえば、データフレーム内のデータ構造は次のようになります。
COL1 COL2
PT1 A T
PT2 T T
PT3 A A
PT4 A T
PT5 0 0
PT6 A A
PT7 T A
PTn T T
ファイルを Plink で実行すると、エラーが発生します。R で自分のファイルを確認したところ、ゼロは「文字」型であることがわかりました。 Rの特定の列に2つの異なるデータ型(数値と文字)を含めることは可能ですか? 0 を数値型にして、文字を文字型のままにしてみましたが、うまくいきません。