問題タブ [fitdistrplus]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
115 参照

r - コンポーネント値が最も低い変数の名前をすばやく見つける方法

分布をフィッティングし、分布名、平均値、sd などで構成されるベクトルを返す関数があります。いくつかの分布をテストしていますが、考慮すべきゼロが多すぎると狂ってしまうため、gofstat() に頼ることはできません。 .

したがって、いくつかの変数の AIC を手動で比較し、どれが実際に「fitdist」クラスであるかを判断し、AIC が最も低い変数の名前を返す必要があります。それができたら、平均、標準偏差などを計算して返します。

コードは現在次のようになっています。

それは機能しますが、考慮すべき数千のサンプルでは非常に遅くなります。それを最適化し、「よりクリーン」で高速にする方法の提案を歓迎します。

ところで、これは私が以前に持っていたものですが、前述したように、サンプルがあまりにも多くのゼロで構成されているため、適合していませんでした (しゃれは意図的ではありません!)

ans[!test & ok] のエラー <- rep(no, length.out = length(ans))[!test & : 置換の長さはゼロです

0 投票する
0 に答える
470 参照

r - fitdist() を使用して負の二項分布を当てはめたときの推定値とサイズ "NA" (NaN ではない) の標準誤差

これは私の最初の投稿なので、改善すべき点や追加情報があればお知らせください。

10.11.6 を実行している Mac で R 3.4.3 を使用しています。

カウントデータを扱っています。負の二項分布のシータ/分散/サイズ パラメーター (k) に興味があります (これらの用語は同じ意味で使用されていると理解しています)。fitdistrplus関数を使用して、パッケージを使用して最尤法でパラメーターを推定するこれらのデータに NB 分布を当てはめていfitdistます。データのさまざまなグループが、さまざまな分布を使用してより適切にモデル化されているかどうかに興味があります。したがって、分布をすべてのデータに当てはめます。次に、データは 1 つの 2 水準因子に基づいて分割され、分布はこれら 2 つの別々のグループに当てはまります。

分布をデータ セット全体に当てはめると、標準誤差を含む mu とサイズの推定値が得られます。次に、データを分割します。この同じアプローチは、データの半分 (グループ A) ではうまく機能しますが、理論的には構造的に同じであるはずの残りの半分 (グループ B) では機能しません。代わりに、mu とサイズの推定値を取得しますが、標準誤差の NA を使用します。

optim背後の関数にlower = c(0,0) と upper = c(inf, inf) を課してfitdistも何も達成されず、出力が NaN ではなく NA であるため、しようとしているのとは何の関係もないと思いますとにかく負の数を見積もってください(よく議論されるエラー100)。

そして、それが何か関係があり、それが何もしなかった場合に備えて、私はすべてのゼロを削除しました。

私の質問は、なぜ NA が生成されるのか (そして、最終的に推定値の標準誤差を取得するにはどうすればよいのか) です。

ここに私のデータと私のコードがあります:

ここに私のコードがあります

0 投票する
2 に答える
4303 参照

r - ガンマ分布による fitdist のエラー

以下は私のコードです:


そしてエラーは言う:

fitdist(s, "gamma", method = "mle") のエラー: 関数 mle はパラメーターの推定に失敗しました。エラー コード 100 が返されました