1 つの列に遺伝子座名があり、もう 1 つの列に DNA 配列があるデータフレームがあります。as.DNAbin{ape}
DNAbinオブジェクトを作成するために、または類似のものを使用しようとしています。
ここにいくつかのサンプルデータがあります:
x <- structure(c("55548", "43297", "35309", "34468", "AATTCAATGCTCGGGAAGCAAGGAAAGCTGGGGACCAACTTCTCTTGGAGACATGAGCTTAGTGCAGTTAGATCGGAAGAGCA", "AATTCCTAAAACACCAATCAAGTTGGTGTTGCTAATTTCAACACCAACTTGTTGATCTTCACGTTCACAACCGTCTTCACGTT", "AATTCACCACCACCACTAGCATACCATCCACCTCCATCACCACCACCGGTTAAGATCGGAAGAGCACACTCTGAACTCCAGTC", "AATTCTATTGGTCATCACAATGGTGGTCCGTGGCTCACGTGCGTTCCTTGTGCAGGTCAACAGGTCAAGTTAAGATCGGAAGA"), .Dim = c(4L, 2L))
y <- as.DNA(x)
R が長さ 2 (2 つの列だと思います) の 4 つの DNA シーケンス (例の 4 行) を持つ一種の DNAbin オブジェクトを作成しようとすると、ラベルはなく、もちろん塩基組成も機能しません。
ドキュメントはあまり明確ではありませんが、パッケージの woodmouse サンプル データで遊んだ後、各ベースを列として行列を作成し、 を使用する必要があると思いますas.DNAbin
。つまり、上記の例では 4 x 84 の行列 (遺伝子座名に 1 列、配列に 83 列?)。これを行う方法に関するアドバイスはありますか?または、より良いアイデアはありますか?
ありがとう