Little Book of Rの分析手順に従っていました。これは素晴らしいチュートリアルですが、機能させるには、このチュートリアルや他の多くのチュートリアルでデータを特定の方法で整理する必要があります。
私のデータは次のように構成されています (非常に小さな小さなサンプル)a:
Phylum Confidence Time Seq_ID Environment Dataset
Acidobacteria 0.801 5 >3134898 Marine 4440037.3
Bacteroidetes 0.812 6 >3066473 Marine 4440037.3
Acidobacteria 0.828 5 >3085551 Gut 4440038.3
Firmicutes 0.830 4 >3087676 Coral 4440036.3
いい方法が欲しい
a) 各環境の細菌門ごとに時間をプロットします。これは、門ごとにプロットを作成する必要があることを意味します。(プロットを参照)
b. 環境ごとに色分けする 2 つの異なる門の環境ごとの時間をプロットします。(プロットを参照)
環境とバクテリアに基づいて新しいデータフレームを作成できることはわかっていますが、3 番目の変数 (時間) を使用するプロットに正しく組み込むことができませんでした。
new_df = myDF[(myDF$Environment=='Marine') & (myDF$Phylum=='Acidobacteria'),]
私はいくつかのことを試しました...
p <- ggplot(myDF, aes(Environment, Time))
p + geom_boxplot(aes(fill = Environment))
プロットを作成しますが、これは門を考慮していません (たとえば、門ごとに個別のプロットが必要です)。
それともこれ...
for (i in environment) #this is a list I created
{
for (j in phyla) #this is a list I created
{
#stats_df = myDF[(myDF$Environment==i) & (myDF$Phylum==j),]
plot(myDF[[j]], myDF[[i]], xlab=NULL, ylab='Time')
}
}
これはエラーになります
Warning in min(x) : no non-missing arguments to min; returning Inf
Warning in max(x) : no non-missing arguments to max; returning -Inf
Warning in min(x) : no non-missing arguments to min; returning Inf
Warning in max(x) : no non-missing arguments to max; returning -Inf
Error in plot.window(...) : need finite 'xlim' values
Calls: plot -> plot.default -> localWindow -> plot.window
Execution halted
shell returned 1
しかし、プロットしたとしても、時間変数はまだ考慮されていません。私が本当に理解しようとしているのは、プロットで 3 つの変数を使用する方法です。