問題タブ [cdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
366 参照

matlab - matlabの累積分布関数を描く

同じサイズのベクトルが 2 つあります。最初のものは任意の順序で任意の異なる数を持つことができ、2 つ目は減少し (ただし同じ要素を持つことができます)、正の整数のみで構成されます。例えば:

次の方法でそれらをプロットしたいと思います。x 軸にはベクトルからのポイントがあり、y 軸には、このポイントの前のベクトル b からの要素の合計が sum(b) で除算されます。したがって、ポイントがあります:

この説明は役に立たないかもしれないと思うので、画像を含めましたここに画像の説明を入力

これは累積分布関数のように見えるので、cdfplotで運を見つけようとしましたが、成功しませんでした。

各線分を個別にプロットして画像を描画する別のオプションがありますが、これを行うより良い方法があることを願っています。

0 投票する
1 に答える
1677 参照

python - 複数の y 値による補間

scipy のいくつかの方法を使用して、一連の x (分位) および y (値) サンプルから分位関数(逆 CDF)を補間しようとしています。これは分位関数であるため、値が繰り返されることがあります。たとえば、CDF は最終的に 1 で平坦になるため、x=1 はいくつかの増加する y 値に対して繰り返されます。

一部の補間方法は関数用に構築されているようで、x の繰り返しには満足していません。x の繰り返しは導関数であると仮定する人さえいます (例: Krogh )。

どうすればこれを回避できますか?

0 投票する
1 に答える
6390 参照

python - 累積分布へのデータ ポイントの適合

ガンマ分布をデータ ポイントに当てはめようとしていますが、以下のコードを使用してそれを行うことができます。

このような小さなガンマ分布を多数使用して、より大きな分布を再構築したいと考えています (より大きな分布は質問には関係なく、pdf ではなく cdf を当てはめようとしている理由を正当化するだけです)。

それを達成するために、pdfではなく累積分布をより小さな分布データに適合させたいと考えています。—より正確には、累積分布の一部だけにデータを当てはめたい

たとえば、累積確率関数 (特定のスケールと形状) が 0.6 に達するまで、データを当てはめたいとします。

fit()この目的のために使用することについて何か考えはありますか?

0 投票する
1 に答える
176 参照

python - 比較失敗の原因となるデータ型の不一致? Pig の Python UDF

Pig スクリプトで使用する Python UDF に問題があります。問題は、入力デルタが実際には存在しない形式であると想定したことだと思いますが、それを修正する方法がわかりません(Python n00b)。

注: Hadoop v.2.0.0、Pig v.0.11.0、Python 2.4.3 の Cloudera (cdh4.3) ディストリビューション。

最初に入力をリストに変換する必要がありますか?

0 投票する
1 に答える
1704 参照

r - Rでパーセンタイルランクを効率的に計算する

返された値ごとにパーセンタイル ランクを報告する必要がある R パッケージを開発しています。ただし、私が持っている分布は巨大です (〜 1,000 万の値)。

私が現在行っている方法は、関数を生成し、ecdfその関数をファイルに保存し、必要に応じてパッケージで読み取ることです。保存したファイルが最終的に巨大 (~120 MB) になり、読み込みに時間がかかりすぎるため、これは問題があります。

Rのパーセンタイルランクを概算することで、これをより効率的にする方法はありますか?

ありがとう