1

私はRを初めて使用します。次のようなデータセットのボックスプロットを手伝ってくれる人はいますか?

ファイル1

     col1 col2     col3     col4  col5
050350005  101   56.625   48.318 RED    
051010002  106   50.625   46.990 GREEN    
051190007   25   65.875   74.545 BLUE    
051191002  246   52.875   57.070 RED    
220050004   55   70       80.274 BLUE    
220150008   75   67.750   62.749 RED    
220170001   77   65.750   54.307 GREEN

ファイル2

     col1 col2     col3     col4  col5
050350005  101   56.625   57     RED
051010002  106   50.625   77     GREEN    
051190007   25   65.875   51.6   BLUE    
051191002  246   52.875   55.070 RED    
220050004   55   70       32     BLUE    
220150008   75   67.750   32.49  RED
220170001   77   65.750   84.07  GREEN

各色 (赤、緑、青) について、別のグループに分割して、file1 と file2の ( col4- ) のMB と RMSE を使用してボックス プロットを作成し、file1 と file2 を比較する必要があります。col3col2

col2<20、20<=col2<50、50 <= col2 <70、col2 >=70 の場合。

つまり、箱ひげ図の場合、x は (<20、20-50、50-70、>70) であり、y は と の差の MB (および RMSE) ですcol4col3

誰も混乱させなかったことを願っています。どうもありがとう。

4

1 に答える 1

1

箱ひげ図が何をするか/何であるかについて少し混乱があるかもしれないと思います。x軸にグループを作成することは可能ですが、私が知る限り、y軸は特定の測定値の分布を示しています(あなたの場合はcol3またはcol4のいずれかを想定しています)。これらの測定値のRMSEまたはMBEではありません。これは、グループごとに1つの値になります。

グループ化変数(x軸用)がcol5なのか、col2にリストしたファイルや基準なのか、それともすべてなのかわかりません。とにかく、プロットを意味のあるものにするためには、より多くのデータが必要になります。

これは、col5とファイルでグループ化されたcol3の箱ひげ図の基本的な例です。

col3 = c(56.625, 50.625, 65.875, 52.875, 70, 67.750, 65.750, 56.625, 50.625, 65.875, 52.875, 70, 67.750, 65.750)
col5 = c("RED", "GREEN", "BLUE", "RED", "BLUE", "RED", "GREEN", "RED", "GREEN", "BLUE","RED","BLUE","RED","GREEN")
myfile = c(1,1,1,1,1,1,1,2,2,2,2,2,2,2)
mydata = data.frame(col3, col5, myfile)
boxplot(col3 ~ col5 + myfile, data = mydata)

ケースの数が限られているため、一部のカテゴリのひげや外れ値が表示されないことに注意してください。このプロットを使用するには、より多くのデータが必要になります。現在表示されているのは、中央値の比較だけです。

プロットが示すことを望んでいたことを明確にできますか?

于 2010-11-17T15:11:34.633 に答える