2

特定の k-mer のリストに対して DNA 配列のリストをスキャンしたい。k-mer リストの各要素は、同じ長さの類似した k-mer のセットであり、次のようになります。

myKmer1=c("TATGGGTTT", "TAAGGGTTT", ...,"CAAGGGTTT")

...

myKmer10=c("GGATTCCAG","CCATTCTTT",..., "CGATTCCTT")

各シーケンスで k-mer のリストの出現を達成するために利用できるソフトウェア/R スクリプトは何ですか?結果は次のような表になります。

k-mers オカレンス テーブル 1: シーケンス内の k-mer のカウントを表示

myKmer1 myKmer2 ...myKmer10

シーケンス1 2 0 3

seq2 1 3 0

...

seq1000 0 1 0

k-mers オカレンス テーブル 2: シーケンス内の k-mer の位置を示す

myKmer1 myKmer2 ...myKmer10

seq1 111, 888 0 123,456,3333

seq2 123 111,223,333 0

...

seq1000 0 1234 0

4

1 に答える 1

1

探している kmer が同じ長さの場合、Jellyfishを dump サブコマンドで使用して、長さ k のすべての kmer のカウントを得ることができます。次に、特定の kmers の出力を解析できます。Jellyfish ユーザー ガイドも参照してください。

于 2014-02-05T05:06:59.237 に答える