特定の k-mer のリストに対して DNA 配列のリストをスキャンしたい。k-mer リストの各要素は、同じ長さの類似した k-mer のセットであり、次のようになります。
myKmer1=c("TATGGGTTT", "TAAGGGTTT", ...,"CAAGGGTTT")
...
myKmer10=c("GGATTCCAG","CCATTCTTT",..., "CGATTCCTT")
各シーケンスで k-mer のリストの出現を達成するために利用できるソフトウェア/R スクリプトは何ですか?結果は次のような表になります。
k-mers オカレンス テーブル 1: シーケンス内の k-mer のカウントを表示
myKmer1 myKmer2 ...myKmer10
シーケンス1 2 0 3
seq2 1 3 0
...
seq1000 0 1 0
k-mers オカレンス テーブル 2: シーケンス内の k-mer の位置を示す
myKmer1 myKmer2 ...myKmer10
seq1 111, 888 0 123,456,3333
seq2 123 111,223,333 0
...
seq1000 0 1234 0