string - 文字列Rで文字列が出現する回数を数える必要がある

Question

つまり、ヌクレオチドのシーケンスがあり、そのシーケンスに gaga という単語が出現する回数を数える必要があります。これは私がこれまでに持っているものです:

dna=c("a","g","c","t")
N=16
x=sample(dna,N,4)
x2=paste(x,collapse="")
x2

出力例を次に示します。

gtaggcctaattataa

最終的には、これを 100 回実行するループを作成し、「gaga」という単語のカウントのヒストグラムをプロットします。そこで、私の主な質問は、文字列 x2 を検索して "gaga" という単語の出現回数をカウントする関数またはコードをどのように記述すればよいかということです。

どんな助けでも大歓迎です！ありがとうございました！

score 2 · Accepted Answer

これは実際には、qdap パッケージにある DWin のソリューションのラッパーです。

x<- c("gtaggcctaattataa", "gtaggcctaatgagaataa", "gagagaga")

library(qdap)
qdap:::termco.h(x, "gaga", seq_along(x))

##   3 word.count term(gaga)
## 1 1          1          0
## 2 2          1          1
## 3 3          1          2

カウントだけが必要な場合：

qdap:::termco.h(x, "gaga", 1:3)[, 3]

string - 文字列Rで文字列が出現する回数を数える必要がある

4 に答える 4

Related

Reference