0

2 つの DNA シーケンス (ORF) を含むファイル ( data.txt ) があります。

data = readDNAStringSet(file="data.txt") 
data
# A DNAStringSet instance of length 2
# width seq                                                       names
#[1]  57 ATGACCCCCACCTCCATCCCCACACTTCTATCCCGCTGCCCCGCCTCTCTCCCCTAA  GPG
#[2]  54 ATGACCCATGAGCACCATGCAGCCAAAACCCTGGGAATCGGCAAAGCCATCTAG     PfK

それらをアミノ酸に変換したい:

t=vector(mode="list", length=length(data))
for (i in seq_along(data))
{
t[[i]]=translate(data[[i]])
}
t
#[[1]]
#19-letter "AAString" instance
#seq: MTPTSIPTLLSRCPASLP*

#[[2]]
#18-letter "AAString" instance
#seq: MTHEHHAAKTLGIGKAI*

次に、テーブルを作成し、次を使用して出力を取得します。

tt=do.call(rbind,t)
write.table(tt,"aa.txt",sep="\t\t")

しかし、これらのコマンドは機能しません。問題が見つかりませんでした。表を書くにはどうすればよいですか?

注:translateは [ ] からのseqinr関数readDNAStringSetであり、[ ] からの関数Biostringsです。

4

1 に答える 1

1

seqinrが必要な理由がわかりません。Biostringsは、必要なすべてを行います。

library("Biostrings")

dna <- readDNAStringSet(file="data.txt")
aa <- translate(dna)

write.table(as.character(aa), file="aa.txt", sep="\t\t")

writeXStringSetの代わりに使いたいかもしれませんwrite.table

于 2013-07-31T21:29:42.287 に答える