問題タブ [cumulative-frequency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
861 参照

python - Matplotlib: X 軸の混雑を避ける

このコードを使用して、累積頻度プロットをプロットしています。

どのように表示されるかは次のとおりで、最初の部分の周りが非常に混雑しています。これは私のデータ拡散によるものです。どうすればもっと明確にできますか?(評判ポイントが足りないのでpostimgにアップします)

http://postimg.org/image/ii5z4czld/

0 投票する
1 に答える
9217 参照

python - matplotlib で逆順の累積ヒストグラムを取得するためのトリック

matplotlib で累積ヒストグラムを逆にする (より良い) トリックがあるかどうか疑問に思っています。

0.0 から 1.0 の範囲のスコアがあり、1.0 が最高のスコアであるとします。ここで、特定のスコアしきい値を超えるサンプル数をプロットすることに興味があります。

ここに画像の説明を入力

デフォルトでは、matplotlib は「サンプル数 <= スコア」のように累積ヒストグラムをプロットします。

ここに画像の説明を入力

私が本当に欲しいのは、累積ヒストグラムが「サンプル数<=スコア」ではなく「サンプル数>=スコア」を表示することです

このようにすることもできますが、x 軸の「マイナス」記号を取り除くにはどうすればよいでしょうか。

ここに画像の説明を入力

より良いアイデアはありますか?

0 投票する
2 に答える
1241 参照

apache-spark - Spark: 頻度値から累積頻度を取得する

私の質問は、単一ノード環境で回答するのはかなり簡単ですが、分散 Spark 環境で同じことを行う方法がわかりません。私が今持っているのは「頻度プロット」で、各項目についてそれが発生する回数があります。たとえば、次のような場合があります。 (1, 2), (2, 3), (3,1)つまり、1 が 2 回、2 が 3 回発生したということです。

私が取得したいのは、各アイテムの累積頻度であるため、上記のインスタンス データから必要な結果は次のとおりです(1, 2), (2, 3+2=5), (3, 1+3+2=6)

mapPartitionsこれまでのところ、パーティションが1つしかない場合に正しい結果が得られる...それ以外の場合は明らかにいいえを使用して、これを実行しようとしました。

どうやってやるの?

ありがとう。マルコ

0 投票する
4 に答える
2170 参照

c++ - 特定の数値の頻度を範囲内の配列で見つけるにはどうすればよいですか?

問題は次のとおりです。サイズNの配列が与えられます。q =クエリの数も与えられます。クエリでは、l = 下限範囲、u = 上限範囲、およびnum = l~u に頻度をカウントする必要がある数が与えられます。

次のように C++ でコードを実装しました。

しかし、私のコードには問題があり、各クエリでマップが空になりませんそのため、同じ数を2回/3回クエリすると、以前に保存された頻度のカウントが追加されます。

これを解決するにはどうすればよいですか?10 ^ 5 のような広範囲のクエリに対しては貧弱なプログラムでしょうか? この問題の効率的な解決策は何ですか?

0 投票する
0 に答える
68 参照

r - 2 つの Y 軸、1 つの頻度、1 つの累積頻度% のヒストグラム

2 つの Y 軸を持つヒストグラムを生成しようとしています。1 つの Y 軸に度数、1 つの Y 軸に累積度数 (%)。これは私が得ることができる最も近いものですが、軸に複数のラベルがあり、軸4が適切にフォーマットされていないプロットでは少し面倒です

よろしくお願いいたします。

0 投票する
1 に答える
64 参照

r - 並べ替えられたデータ フレームから並べ替えられていないデータ フレームに最も近い値を描画する

に 2 つのデータ フレームがありRます。cumFreqDist最初のデータ フレームは、期間が関連付けられた累積度数分布 ( ) です。データ フレームの最初の行は次のようになります。

runif2 番目のデータ フレームは、次のコードを使用して、分布から 10000 回描画されます。

の各行について、対応する を検索し、対応する値を の新しい列に追加しtestDataたいと考えています。は実際のデータ フレームに代わるテスト データ フレームであるため、並べ替えは行いません。cumfreqcumFreqDistTimetestDatatestDatatestData

累積頻度を扱っているため、値testDataが返されるべき値である場合は です。つまり、値を超えない最も近い値を見つけて、その 1 つの値だけを返す必要があります。23.30...Time8cumfreqtestData

このdata.tableパッケージは他の同様の質問で言及されていますが、私の限定的な理解では、このパッケージでは (データ テーブルへの変換後に) 両方のデータ フレームでキーを識別する必要があり、testData値が割り当ての要件を満たしているとは想定できません。キーとして-キーを割り当てるとデータがソートされるようです。これにより、後でシードを設定したときに問題が発生します。

0 投票する
1 に答える
915 参照

vba - VBAで累積分布図を作ろうとしています。

初めてのポスター。この累積分布図を作成するために、直線の xy 散布図を作成します。y 軸の値はパーセンタイルで、すべて A2:A100 にあります。対応する x 値は列 B から n にあります。n は変数であり、チャート作成のためにユーザーが指定したシミュレートされた戦略の数に依存します。A2:A100 が隣接する列にあるすべての x 値系列の y 値である xy 散布図を作成するには、VBA コードが必要です。名前付きセル、cumulativeColumns は、x 値を持つ列数をカウントします。SeriesCollections がどのように機能するかを調査した結果、cumulativeColumns 式の結果に基づいて停止する Do Until ループを使用することを最初に考えました。私はこのコードがうまくいくと思った:

ループの初回は q = 1 なので、最初のシリーズは列 B のデータを取得します。ループの2回目はq = 2なので、2番目のシリーズが定義され、列Cのデータを取得するなど、cumulativeColumns.Valueの結果ごとにデータを含む列がなくなるまで停止すると考えました。しかし、エラー 1004、アプリケーション定義またはオブジェクト定義エラーが発生します。