問題を簡単に説明させてください。このようなデータセットを想像してください
data<- data.frame("Amino.acid" = c("TRPPS;PNSTED", "ERDDS", "PSRND", "SDEEN", "GSRTN"),
"log2.ratio"=c(2.4,0,-1,-2,-1))
実際には、私のリストははるかに長く、たとえば 12000 行です。私が本当にやりたいことは、特定のアミノ酸パターンの頻度を取得し、密度と対数比をプロットすることです. したがって、たとえば、パターン RXXS はアミノ酸列で検出され、場合によっては配列が「;」で区切られます。パターン分析は両方に対して行う必要があります。
多くのlog2比に対してgsubやサブセット関数のような醜いものを考えることができますが、エレガントな解決策があるはずです。(たぶん密度関数で??)
最後に、特定のパターンの密度 (y) と log2raito (x) のプロットと、この特定のアミノ酸配列パターン以外のすべてのプロットを取得したいと思います。