0

Little Book of Rの分析手順に従っていました。これは素晴らしいチュートリアルですが、機能させるには、このチュートリアルや他の多くのチュートリアルでデータを特定の方法で整理する必要があります。

私のデータは次のように構成されています (非常に小さな小さなサンプル)a:

Phylum Confidence Time Seq_ID Environment Dataset
Acidobacteria 0.801 5 >3134898 Marine 4440037.3
Bacteroidetes 0.812 6 >3066473 Marine 4440037.3
Acidobacteria 0.828 5 >3085551 Gut 4440038.3
Firmicutes    0.830 4 >3087676 Coral 4440036.3

いい方法が欲しい

a) 各環境の細菌門ごとに時間をプロットします。これは、門ごとにプロットを作成する必要があることを意味します。(プロットを参照)

b. 環境ごとに色分けする 2 つの異なる門の環境ごとの時間をプロットします。(プロットを参照)

環境とバクテリアに基づいて新しいデータフレームを作成できることはわかっていますが、3 番目の変数 (時間) を使用するプロットに正しく組み込むことができませんでした。

new_df = myDF[(myDF$Environment=='Marine') & (myDF$Phylum=='Acidobacteria'),]

私はいくつかのことを試しました...

p <- ggplot(myDF, aes(Environment, Time))
p + geom_boxplot(aes(fill = Environment))

プロットを作成しますが、これは門を考慮していません (たとえば、門ごとに個別のプロットが必要です)。

それともこれ...

 for (i in environment) #this is a list I created
 {
     for (j in phyla) #this is a list I created
     {
        #stats_df = myDF[(myDF$Environment==i) & (myDF$Phylum==j),]
        plot(myDF[[j]], myDF[[i]], xlab=NULL, ylab='Time')
      }
 }

これはエラーになります

Warning in min(x) : no non-missing arguments to min; returning Inf
Warning in max(x) : no non-missing arguments to max; returning -Inf
Warning in min(x) : no non-missing arguments to min; returning Inf
Warning in max(x) : no non-missing arguments to max; returning -Inf
Error in plot.window(...) : need finite 'xlim' values
Calls: plot -> plot.default -> localWindow -> plot.window
Execution halted

shell returned 1

しかし、プロットしたとしても、時間変数はまだ考慮されていません。私が本当に理解しようとしているのは、プロットで 3 つの変数を使用する方法です。

4

1 に答える 1

2

門が因子変数であると仮定する

library(ggplot2)
g<- ggplot(myDF, aes(Environment, Time))
g + geom_point() + facet_grid(. ~ phylum)

ここに画像の説明を入力

 library(ggplot2)

 g<- ggplot(df1, aes(Environment, Time))
 g + geom_point() + facet_grid(phylum ~ .)

ここに画像の説明を入力

詳細はこちらをご覧ください。

于 2013-10-12T22:58:32.473 に答える