質問やRパッケージでこれを見つけることができませんでした。うまくいけば簡単です。
2 つの仮説的な遺伝子配列を取り上げます。
Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA
2 つの配列間の単一ヌクレオチドのパーセンテージ差 (たとえば 15%) を生成する R コードが必要です。
何かご意見は?前もって感謝します。
質問やRパッケージでこれを見つけることができませんでした。うまくいけば簡単です。
2 つの仮説的な遺伝子配列を取り上げます。
Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA
2 つの配列間の単一ヌクレオチドのパーセンテージ差 (たとえば 15%) を生成する R コードが必要です。
何かご意見は?前もって感謝します。
私があなたの質問を正しく理解していれば、単純な文字列比較を行うだけで済みます。例えば、
R> seq1 = c("A", "T", "G", "C", "G", "C",
"A", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "T")
R> seq2 = c("A", "T", "G", "G", "G", "C",
"T", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "A")
R> seq1 != seq2
[1] FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE TRUE
R> sum(seq1 != seq2)/length(seq1)*100
[1] 16.67
上記の形式でデータを取得するには、strsplit
関数を見てください。