つまり、ヌクレオチドのシーケンスがあり、そのシーケンスに gaga という単語が出現する回数を数える必要があります。これは私がこれまでに持っているものです:
dna=c("a","g","c","t")
N=16
x=sample(dna,N,4)
x2=paste(x,collapse="")
x2
出力例を次に示します。
gtaggcctaattataa
最終的には、これを 100 回実行するループを作成し、「gaga」という単語のカウントのヒストグラムをプロットします。そこで、私の主な質問は、文字列 x2 を検索して "gaga" という単語の出現回数をカウントする関数またはコードをどのように記述すればよいかということです。
どんな助けでも大歓迎です!ありがとうございました!