これがスタック オーバーフローの範囲外かどうかはわかりません。もしそうなら教えてください。
私の入力データ。
私は、468 の異なる捕獲セッション中に捕獲された個体のサイズ分布を視覚化しようとしています (またはまだ決定されていない分析を実行しようとしています)。キャプチャ セッションには "id" というラベルが付けられており、簡単にするためにセッションに 1:468 から番号を付けた新しい列 "newID" を作成しました (コードに興味がある人のために、この新しい列を作成するループを作成しました)。私がプロットしているサイズは、列「SL」にあります。
また、特定のキャプチャ セッションが発生した「日付」、「年」、「月」、「場所」、および「クリーク」を指定する列もあります。データは間違いなく小さなセグメントに分割できます (たとえば、4 つの小川があるので、小川ごとに個別のプロットを作成できます)。
これまでのところ、次のコードを使用して、「年」でファセット化された単純な予備プロットを作成しました (データが密集しすぎないように簡単にするため)。
library(ggplot2)
CreekDat <-read.table("CreekData.txt",header=TRUE)
CreekData4<-data.frame(CreekDat)
DOT <-ggplot(CreekData4,aes(newID,SL,color=factor(newID)))
DOT<-DOT+facet_grid(Year~.)
DOT<-DOT+stat_boxplot(aes(x = newID,y=SL))
DOT
そして、この結果を得ましたhttp://ufsnook.smugmug.com/photos/i-psJZ6kw/0/X3/i-psJZ6kw-X3.jpg
サイズ分布を表示したいイベントが 500 個まであるのは少し多すぎます...このデータで機能する可能性のある他のプロットオプションを誰かが知っているかどうか、現在使用しているボックスプロット内で作業するためのアドバイスがあるかどうか疑問に思っていました。または、私が見ることができる非視覚的分析のアイデアがあります。