私は次のようなDNA配列を持っています:cgtcgctgtttgtcaaagtcg....
それはおそらく1000文字以上の長さです。
ただし、たとえば5〜200の文字だけを見て、この文字列のサブセットを新しいオブジェクトとして定義したいと思います。
関数を調べてnchar
みましたが、これを行うものが見つかりませんでした。
サブストリング関数を使用します。
> tmp.string <- paste(LETTERS, collapse="")
> tmp.string <- substr(tmp.string, 4, 10)
> tmp.string
[1] "DEFGHIJ"
大規模な生物学的シーケンスまたは一連のシーケンスを処理する必要がある場合は、良い選択であるBioconductor パッケージBiostringsも参照してください。
#source("http://bioconductor.org/biocLite.R");biocLite("Biostrings")
library(Biostrings)
s <-paste(rep("gtcgctgtttgtcaac",20),collapse="")
d <- DNAString(s)
d[5:200]
as.character(d[5:200])