問題タブ [boxplot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R の boxplot で使用されるカット関数の式を含むラベル
私は cut 関数を使用して数値変数を 2 つのレベルを持つ因子に変換し、これを次のような箱ひげ図で使用しています。
カット関数で使用される各ラベルの下に、サンプル サイズを "n=..." として含めたいと思います。このように、サブセットで長さを使用してサンプルサイズを取得できます。
cat and pasteを使用して、ラベルの下にサンプルサイズを取得します
私の問題は、これをカット関数のラベル引数に挿入できなかったことです。単純に、上記をラベル ベクトルに挿入すると、boxplot は正常に出力されますが、R コンソールにラベルが出力されます。式関数を使用する必要があるかもしれないと思いますが、これも機能していません。任意のヘルプまたは代替方法をいただければ幸いです。
r - 要約上のR箱ひげ図
3つのオプションから選択するユーザーを表す以下の(簡略化された)データから、値の係数に基づいて、ユーザーが値を選択した回数のパーセンテージの箱ひげ図のセットを作成します。したがって、3つの箱ひげ図が必要です。ユーザーが0、1、2を選択した割合です。
Rでよく行うように、明らかな何かが欠けていると確信しています。を使用してパーセンテージを取得できますが、by(dat, dat$user, function(user) {table(user$value)/length(user$value)*100})
それを箱ひげ図に変換する方法がわかりません。
それが理にかなっていることを願っています。
r - 中央値に基づいて箱ひげ図を並べ替える
Rを使用して、中央値でソートされた一連の箱ひげ図を作成したいと思います。次に、次のように実行するとします。
これにより、コストがy軸に表示され、タイプカテゴリがx軸に表示される場合に、いくつかの箱ひげ図が得られます。
ただし、私が欲しいのは、箱ひげ図の数値を中央値の高いものから低いものへと並べ替えたものです。タイプ(AまたはB)のラベルを変更して、中央値の最小値と最大値を数値で示す必要があるのではないかと疑っていますが、問題を解決するためのより賢い方法があるのではないかと思います。
r - 線のある箱ひげ図の結合手段(ggplot2)
複数のボックスを示す箱ひげ図があります。各ボックスの平均を線でつなぎたい。箱ひげ図はデフォルトでは平均を表示しません。代わりに、中央の線は中央値のみを示します。私は試した
これは動作しません。
興味深いことに、
各ボックスに中央値を描画します。「ライン」が機能しないのはなぜですか?
このようなものですが、ggplot2を使用しています。http://www.aliquote.org/articles/tech/RMB/c4_sols/plot45.png
r - R - boxplot での順序付け
2 つの要因でグループ化された一連の箱ひげ図をRで作成しようとしています。なんとかプロットを作成できましたが、ボックスを正しい方向に並べることができません。
私が使用しているデータ ファームは次のようになります。
私は試した:
これにより、ボックスがアルファベット順に並べられました (最初の 3 つは「高」処理であり、その後、これら 3 つの中で種名のアルファベット順に並べられました)。
箱ひげ図を低>中>高の順に並べてから、種のG>R>Bの各グループ内に配置します。
だから私は数式で係数を使用してみました:
それから:
ただし、ボックスはまだ同じ順序で靴を履いています。ラベルは異なりますが、ボックスは移動していません。
各データセットを引き出して、それらをすべてまとめて個別にプロットしました。
これは私が望むものを与えますが、よりエレガントな方法でこれを行うことを好むので、より大きなデータセットのためにそれぞれを個別に引き出す必要はありません.
読み込み可能なデータ:
r - ggplot2 を使用した Boxplot と Histogram の組み合わせ
連続変数を視覚化するために、ヒストグラムと箱ひげ図を組み合わせようとしています。ここに私がこれまでに持っているコードがあります
x 軸の位置合わせ以外は問題ないように見えます。それらを整列させる方法を誰か教えてもらえますか? あるいは、誰かが を使用してこのグラフを作成するより良い方法を持っている場合はggplot2
、それも高く評価されます。
r - ggplot2 で 1 つの軸のみを log10 スケールに変換する
次の問題があります。箱ひげ図で離散変数と連続変数を視覚化したいのですが、後者には極端に高い値がいくつかあります。これにより、箱ひげ図が無意味になります (グラフのポイントと「本体」でさえ小さすぎる)。そのため、これを log10 スケールで示したいと思います。視覚化から極端な値を除外できることは承知していますが、そうするつもりはありません。
ダイヤモンド データの簡単な例を見てみましょう。
ここでは問題は深刻ではありませんが、log10 スケールで値を表示する理由を想像していただければ幸いです。試してみよう:
ご覧のとおり、y 軸は log10 でスケーリングされていて問題ないように見えますが、x 軸に問題があり、プロットが非常に奇妙になっています。
では問題は発生しませんがscale_log
、この方法ではカスタム フォーマッタを使用できないため、これはオプションではありません。例えば:
私の質問: y 軸に log10 スケールのボックスプロットをプロットするソリューションを知っている人はいますか?このスレッドformatter
のような関数でラベルを自由にフォーマットできますか?
回答とコメントに基づいて回答者を支援するために質問を編集します。
私が本当に求めているもの: 1 つの log10 変換された軸 (y) で、科学的なラベルはありません。(formatter=dollar)
ドルまたはカスタム形式のようにラベルを付けたいと思います。
@hadley の提案を試すと、次の警告が表示されます。
y 軸のラベルを変更しない場合:
r - geom_boxplot でウィスカーの定義を変更する
ggplot2 / geom_boxplot を使用して、ウィスカーが 0.25 - 1.5 IQR / 0.75 + IQR ではなく 5 および 95 パーセンタイルとして定義され、それらの新しいウィスカーの外れ値が通常どおりプロットされる箱ひげ図を作成しようとしています。geom_boxplot の美学に ymax / ymin が含まれていることがわかりますが、ここに値を入れる方法がわかりません。のようです:
助けることができるはずですが、この統計の結果を関連付けて適切な geom_boxplot() 美学を設定する方法がわかりません:
ボックスプロットのようなオブジェクトを手動で本質的に構築することについて人々が言及している他の投稿を見てきましたが、描画されている2つの変数の意味を修正するだけで、ボックスプロットのゲシュタルト全体を維持したいと思います。
python - matplotlib の可変長データを含む箱ひげ図
テキストファイルにいくつかのデータを収集し、箱ひげ図を作成したいと考えています。ただし、このデータファイルには、たとえば可変長の行が含まれています。
同じ長さで私はただできる
可変長データ行を処理するにはどうすればよいですか?
r - R の Boxplot() 関数からフレームを削除する
boxplot()
R関数で箱ひげ図を作成するときにフレームを削除する方法を知っている人はいますか?
plot()
関数にはオプションの引数 があり、それが機能します...しかし、それは関数frame=F
に含まれていませんboxplot()
...
どうもありがとうございました!