問題タブ [cdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - matlabの累積分布関数を描く
同じサイズのベクトルが 2 つあります。最初のものは任意の順序で任意の異なる数を持つことができ、2 つ目は減少し (ただし同じ要素を持つことができます)、正の整数のみで構成されます。例えば:
次の方法でそれらをプロットしたいと思います。x 軸にはベクトルからのポイントがあり、y 軸には、このポイントの前のベクトル b からの要素の合計が sum(b) で除算されます。したがって、ポイントがあります:
この説明は役に立たないかもしれないと思うので、画像を含めました
これは累積分布関数のように見えるので、cdfplotで運を見つけようとしましたが、成功しませんでした。
各線分を個別にプロットして画像を描画する別のオプションがありますが、これを行うより良い方法があることを願っています。
python - 累積分布へのデータ ポイントの適合
ガンマ分布をデータ ポイントに当てはめようとしていますが、以下のコードを使用してそれを行うことができます。
このような小さなガンマ分布を多数使用して、より大きな分布を再構築したいと考えています (より大きな分布は質問には関係なく、pdf ではなく cdf を当てはめようとしている理由を正当化するだけです)。
それを達成するために、pdfではなく累積分布をより小さな分布データに適合させたいと考えています。—より正確には、累積分布の一部だけにデータを当てはめたい。
たとえば、累積確率関数 (特定のスケールと形状) が 0.6 に達するまで、データを当てはめたいとします。
fit()
この目的のために使用することについて何か考えはありますか?
python - 比較失敗の原因となるデータ型の不一致? Pig の Python UDF
Pig スクリプトで使用する Python UDF に問題があります。問題は、入力デルタが実際には存在しない形式であると想定したことだと思いますが、それを修正する方法がわかりません(Python n00b)。
注: Hadoop v.2.0.0、Pig v.0.11.0、Python 2.4.3 の Cloudera (cdh4.3) ディストリビューション。
最初に入力をリストに変換する必要がありますか?
r - Rでパーセンタイルランクを効率的に計算する
返された値ごとにパーセンタイル ランクを報告する必要がある R パッケージを開発しています。ただし、私が持っている分布は巨大です (〜 1,000 万の値)。
私が現在行っている方法は、関数を生成し、ecdf
その関数をファイルに保存し、必要に応じてパッケージで読み取ることです。保存したファイルが最終的に巨大 (~120 MB) になり、読み込みに時間がかかりすぎるため、これは問題があります。
Rのパーセンタイルランクを概算することで、これをより効率的にする方法はありますか?
ありがとう