文字列内の定義された位置にある文字を置き換えたい R スクリプトのヘルプが必要です。定義された位置と置換文字はマトリックスに保持されます。
私は Bioconductor パッケージを頻繁に使用しましたが、実際のプログラミングは行っていません。他の言語の経験がないので、できればRを使いたいです。
これが私の例の文字列です (30 bp 参照アミノ酸 (AA) シーケンス):
df <- EVHGSGIRVDSNTTFLTPVATGNQYLKDGG
以下は data.frame の例です。
サンプル <- read.csv("samples.csv")
Sample 1 12 17 22 23 25
1 K N T E N D
2 E K T E N D
3 E N T G N Y
4 E K T E N D
5 E N T G K D
6 K N T E N D
7 K K T G K D
8 E K T E N D
9 E N K G N D
10 E N T E N D
列 1 はサンプル番号です。サンプル 1 ~ 10 をリストしました。次の列のラベルは、参照シーケンス内の位置に対応しています。各行には、サンプルの AA が含まれています。
私の出力は、サンプルの一意の完全なシーケンスになります。マトリックスに含まれる情報を使用して、各サンプルのリファレンス シーケンスの AA を置き換え、シーケンスを出力する必要があります。
Sample Sample Sequence
1 KVHGSGIRVDSNTTFLTPVATENQDLKDGG
2 EVHGSGIRVDSKTTFLTPVATENQDLKDGG
3 EVHGSGIRVDSNTTFLTPVATGNQYLKDGG
4 EVHGSGIRVDSKTTFLTPVATENQDLKDGG
5 EVHGSGIRVDSNTTFLTPVATGKQDLKDGG
6 KVHGSGIRVDSNTTFLTPVATENQDLKDGG
7 KVHGSGIRVDSKTTFLTPVATGKQDLKDGG
8 EVHGSGIRVDSKTTFLTPVATENQDLKDGG
9 EVHGSGIRVDSNTTFLKPVATGNQDLKDGG
10 EVHGSGIRVDSNTTFLTPVATENQDLKDGG
私が始めるのに役立つ提案はありますか? 私のサンプル セットは大きく、225 個のサンプルと 60 個のポリモーフィック サイトがあります。前もって感謝します。