1

ある尺度で日差を示す数値を含むデータセットがあります。

https://dl.dropbox.com/u/22681355/diff.csv

まれな大きな変化に特に重点を置いて、違いの分布のプロットを作成したいと思います。

hist() 関数を使用して各列をプロットしようとしましたが、データの詳細な図は実際には提供されません。

たとえば、データセットの最初の列をプロットすると、次のプロットが生成されます。

https://dl.dropbox.com/u/22681355/Rplot.pdf

私の問題は、これがめったにない大きな偏差の詳細をほとんど与えないことです。

これを行う最も簡単な方法は何ですか?

また、このデータを表にまとめる方法について何か提案はありますか? たとえば、最小値、最大値、平均値を表示するだけでなく、分位点も表示しますか? 他のアイデアはありますか?

4

3 に答える 3

2

箱ひげ図を使用して、データの分布を視覚化できます。

sdiff <- read.csv("https://dl.dropbox.com/u/22681355/diff.csv")

boxplot(sdiff[,-1])

外れ値は円として印刷されます。

ここに画像の説明を入力

于 2012-10-24T15:19:08.100 に答える
2

外れ値を識別するための @Sven の提案を支持しますhistが、デフォルトで選択されるものよりも密度の高いブレークポイントのセットを指定することで、ヒストグラムをより細かく調整できます。

d <- read.csv('https://dl.dropbox.com/u/22681355/diff.csv', header=TRUE, row.names=1)
with(d, hist(a, breaks=seq(min(a), max(a), length.out=100)))

ここに画像の説明を入力

于 2012-10-24T15:25:54.270 に答える
1

ヴァイオリン プロットが役立つ場合があります。

df <- read.csv('https://dl.dropbox.com/u/22681355/diff.csv')
library(vioplot)
with(df,vioplot(a,b,c,d,e,f,g,h,i,j))

ヴァイオリンプロット

変換されたデータに箱ひげ図を使用します。たとえば、次のようになります。

boxplot(df[,-1]/sqrt(abs(df[,-1])))

boxplot (データ変換)

明らかに、変換後のヒストグラムも見栄えが良くなります。

于 2012-10-24T15:26:33.877 に答える