1

つまり、ヌクレオチドのシーケンスがあり、そのシーケンスに gaga という単語が出現する回数を数える必要があります。これは私がこれまでに持っているものです:

dna=c("a","g","c","t")
N=16
x=sample(dna,N,4)
x2=paste(x,collapse="")
x2

出力例を次に示します。

gtaggcctaattataa

最終的には、これを 100 回実行するループを作成し、「gaga」という単語のカウントのヒストグラムをプロットします。そこで、私の主な質問は、文字列 x2 を検索して "gaga" という単語の出現回数をカウントする関数またはコードをどのように記述すればよいかということです。

どんな助けでも大歓迎です!ありがとうございました!

4

4 に答える 4

2

これは実際には、qdap パッケージにある DWin のソリューションのラッパーです。

x<- c("gtaggcctaattataa", "gtaggcctaatgagaataa", "gagagaga")

library(qdap)
qdap:::termco.h(x, "gaga", seq_along(x))

##   3 word.count term(gaga)
## 1 1          1          0
## 2 2          1          1
## 3 3          1          2

カウントだけが必要な場合:

qdap:::termco.h(x, "gaga", 1:3)[, 3]
于 2013-10-10T19:34:35.753 に答える