“cumulative-frequency”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

861 参照

python - Matplotlib: X 軸の混雑を避ける

このコードを使用して、累積頻度プロットをプロットしています。

どのように表示されるかは次のとおりで、最初の部分の周りが非常に混雑しています。これは私のデータ拡散によるものです。どうすればもっと明確にできますか？(評判ポイントが足りないのでpostimgにアップします)

http://postimg.org/image/ii5z4czld/

2015-02-13T16:14:54.550

0 投票する

1 に答える

9217 参照

python - matplotlib で逆順の累積ヒストグラムを取得するためのトリック

matplotlib で累積ヒストグラムを逆にする (より良い) トリックがあるかどうか疑問に思っています。

0.0 から 1.0 の範囲のスコアがあり、1.0 が最高のスコアであるとします。ここで、特定のスコアしきい値を超えるサンプル数をプロットすることに興味があります。

ここに画像の説明を入力

デフォルトでは、matplotlib は「サンプル数 <= スコア」のように累積ヒストグラムをプロットします。

ここに画像の説明を入力

私が本当に欲しいのは、累積ヒストグラムが「サンプル数<=スコア」ではなく「サンプル数>=スコア」を表示することです

このようにすることもできますが、x 軸の「マイナス」記号を取り除くにはどうすればよいでしょうか。

ここに画像の説明を入力

より良いアイデアはありますか？

python matplotlib histogram cumulative-frequency

user2489252

2015-03-05T23:30:08.427

0 投票する

2 に答える

1241 参照

apache-spark - Spark: 頻度値から累積頻度を取得する

私の質問は、単一ノード環境で回答するのはかなり簡単ですが、分散 Spark 環境で同じことを行う方法がわかりません。私が今持っているのは「頻度プロット」で、各項目についてそれが発生する回数があります。たとえば、次のような場合があります。 (1, 2), (2, 3), (3,1)つまり、1 が 2 回、2 が 3 回発生したということです。

私が取得したいのは、各アイテムの累積頻度であるため、上記のインスタンスデータから必要な結果は次のとおりです(1, 2), (2, 3+2=5), (3, 1+3+2=6)。

mapPartitionsこれまでのところ、パーティションが1つしかない場合に正しい結果が得られる...それ以外の場合は明らかにいいえを使用して、これを実行しようとしました。

どうやってやるの？

ありがとう。マルコ

apache-spark cumulative-frequency

2015-03-14T09:13:28.073

0 投票する

4 に答える

2170 参照

c++ - 特定の数値の頻度を範囲内の配列で見つけるにはどうすればよいですか?

問題は次のとおりです。サイズNの配列が与えられます。q =クエリの数も与えられます。クエリでは、l = 下限範囲、u = 上限範囲、およびnum = l~u に頻度をカウントする必要がある数が与えられます。

次のように C++ でコードを実装しました。

しかし、私のコードには問題があり、各クエリでマップが空になりません。そのため、同じ数を2回/3回クエリすると、以前に保存された頻度のカウントが追加されます。

これを解決するにはどうすればよいですか？10 ^ 5 のような広範囲のクエリに対しては貧弱なプログラムでしょうか? この問題の効率的な解決策は何ですか?

c++arrays frequency cumulative-frequency

2015-05-05T15:31:22.010

0 投票する

0 に答える

68 参照

r - 2 つの Y 軸、1 つの頻度、1 つの累積頻度% のヒストグラム

2 つの Y 軸を持つヒストグラムを生成しようとしています。1 つの Y 軸に度数、1 つの Y 軸に累積度数 (%)。これは私が得ることができる最も近いものですが、軸に複数のラベルがあり、軸4が適切にフォーマットされていないプロットでは少し面倒です

よろしくお願いいたします。

r histogram cumulative-frequency

2015-05-14T22:05:25.490

0 投票する

1 に答える

64 参照

r - 並べ替えられたデータフレームから並べ替えられていないデータフレームに最も近い値を描画する

に 2 つのデータフレームがありRます。cumFreqDist最初のデータフレームは、期間が関連付けられた累積度数分布 ( ) です。データフレームの最初の行は次のようになります。

runif2 番目のデータフレームは、次のコードを使用して、分布から 10000 回描画されます。

の各行について、対応するを検索し、対応する値をの新しい列に追加しtestDataたいと考えています。は実際のデータフレームに代わるテストデータフレームであるため、並べ替えは行いません。cumfreqcumFreqDistTimetestDatatestDatatestData

累積頻度を扱っているため、値testDataが返されるべき値である場合はです。つまり、値を超えない最も近い値を見つけて、その 1 つの値だけを返す必要があります。23.30...Time8cumfreqtestData

このdata.tableパッケージは他の同様の質問で言及されていますが、私の限定的な理解では、このパッケージでは (データテーブルへの変換後に) 両方のデータフレームでキーを識別する必要があり、testData値が割り当ての要件を満たしているとは想定できません。キーとして-キーを割り当てるとデータがソートされるようです。これにより、後でシードを設定したときに問題が発生します。

r matching cumulative-frequency

2015-06-05T02:11:33.997

0 投票する

1 に答える

915 参照

vba - VBAで累積分布図を作ろうとしています。

初めてのポスター。この累積分布図を作成するために、直線の xy 散布図を作成します。y 軸の値はパーセンタイルで、すべて A2:A100 にあります。対応する x 値は列 B から n にあります。n は変数であり、チャート作成のためにユーザーが指定したシミュレートされた戦略の数に依存します。A2:A100 が隣接する列にあるすべての x 値系列の y 値である xy 散布図を作成するには、VBA コードが必要です。名前付きセル、cumulativeColumns は、x 値を持つ列数をカウントします。SeriesCollections がどのように機能するかを調査した結果、cumulativeColumns 式の結果に基づいて停止する Do Until ループを使用することを最初に考えました。私はこのコードがうまくいくと思った：

ループの初回は q = 1 なので、最初のシリーズは列 B のデータを取得します。ループの2回目はq = 2なので、2番目のシリーズが定義され、列Cのデータを取得するなど、cumulativeColumns.Valueの結果ごとにデータを含む列がなくなるまで停止すると考えました。しかし、エラー 1004、アプリケーション定義またはオブジェクト定義エラーが発生します。

vba excel cumulative-frequency

2015-08-11T21:05:09.663

問題タブ [cumulative-frequency]

Reference