0

文字列内の定義された位置にある文字を置き換えたい R スクリプトのヘルプが必要です。定義された位置と置換文字はマトリックスに保持されます。

私は Bioconductor パッケージを頻繁に使用しましたが、実際のプログラミングは行っていません。他の言語の経験がないので、できればRを使いたいです。

これが私の例の文字列です (30 bp 参照アミノ酸 (AA) シーケンス):

df <- EVHGSGIRVDSNTTFLTPVATGNQYLKDGG

以下は data.frame の例です。

サンプル <- read.csv("samples.csv")

Sample  1   12  17  22  23  25
1       K   N   T   E   N   D
2       E   K   T   E   N   D
3       E   N   T   G   N   Y
4       E   K   T   E   N   D
5       E   N   T   G   K   D
6       K   N   T   E   N   D
7       K   K   T   G   K   D
8       E   K   T   E   N   D
9       E   N   K   G   N   D
10      E   N   T   E   N   D

列 1 はサンプル番号です。サンプル 1 ~ 10 をリストしました。次の列のラベルは、参照シーケンス内の位置に対応しています。各行には、サンプルの AA が含まれています。

私の出力は、サンプルの一意の完全なシーケンスになります。マトリックスに含まれる情報を使用して、各サンプルのリファレンス シーケンスの AA を置き換え、シーケンスを出力する必要があります。

Sample  Sample Sequence 
 1      KVHGSGIRVDSNTTFLTPVATENQDLKDGG  
 2      EVHGSGIRVDSKTTFLTPVATENQDLKDGG  
 3      EVHGSGIRVDSNTTFLTPVATGNQYLKDGG  
 4      EVHGSGIRVDSKTTFLTPVATENQDLKDGG  
 5      EVHGSGIRVDSNTTFLTPVATGKQDLKDGG  
 6      KVHGSGIRVDSNTTFLTPVATENQDLKDGG  
 7      KVHGSGIRVDSKTTFLTPVATGKQDLKDGG  
 8      EVHGSGIRVDSKTTFLTPVATENQDLKDGG  
 9      EVHGSGIRVDSNTTFLKPVATGNQDLKDGG  
 10     EVHGSGIRVDSNTTFLTPVATENQDLKDGG  

私が始めるのに役立つ提案はありますか? 私のサンプル セットは大きく、225 個のサンプルと 60 個のポリモーフィック サイトがあります。前もって感謝します。

4

1 に答える 1