ボックスプロットを作成したい大規模なデータベースがあります。
データ: test.hospital
y: テスト結果 (%): 合計 1500 サンプル
x1: 異なる年 (2011-2017)
x2: 異なる病院 (30 の異なる病院名)
サンプルサイズは病院によって大きく異なるため、実際にはデータが少なすぎてデータについて何も言えない場合があります。したがって、サンプル サイズが 15 未満のすべての病院を箱ひげ図から除外したいと思います。
だから私がしたいのは、病院がサンプリングされた回数の頻度で追加の行を作成し、その行を使用してボックスプロットの低いサンプルサイズを除外することです..
おそらくおわかりのように、私は R に非常に慣れていないので、ほとんどの人にとってこれは問題です。非常に簡単な質問です...それでも私は本当にそれに対する答えが欲しいです...!
どうもありがとうございます:)