これはばかげた質問かもしれません![0;0.3;0.7]など、いくつかのデータの確率分布を表す配列Pがあります。Pの離散確率分布のタイプまたはクラスをどのように決定できますか? 元のデータは利用できません。
dfittool または fitdist では、データを入力として指定する必要がありますが、その確率分布は既に得られています。何か案は?
これはばかげた質問かもしれません![0;0.3;0.7]など、いくつかのデータの確率分布を表す配列Pがあります。Pの離散確率分布のタイプまたはクラスをどのように決定できますか? 元のデータは利用できません。
dfittool または fitdist では、データを入力として指定する必要がありますが、その確率分布は既に得られています。何か案は?
講義や読書中に、さまざまな確率分布を見たことがあるかもしれません。必要なのは、指定された分布を候補に対してプロットすることだけです。分布自体がパラメータ化されているため、カーブ フィッティングまたは試行終了エラーが発生します。誤差が最小で最適な分布が、探している分布である可能性があります。
一部のデータ(特に、例のように n が低い場合)がどのような分布から来ているかをアプリオリに見つけることはできません。
データを生成したプロセスがわかれば、どの分布をテストすればよいかがわかります。おそらく、データはガンマ分布の族から来ているかもしれませんし、ワイブル分布の族から来ているのかもしれません。次に、これらの一般的な分布を当てはめ、より一般的な分布に単純化する可能性があるかどうかを確認できます。
データが特定の分布をどの程度近似できるかを視覚的に表現するには、PROBPLOTを使用できます。
可能な分布を特定したら、それらをデータに当てはめ、ベイジアン情報量基準 (BIC)を使用して、どの当てはめがデータを最もよく表しているかを比較できます。膨大な数のノイズのないデータがない限り、BIC が比較的低い可能性のある分布が複数ある場合、どの近似が正しいかを判断することは不可能であることに注意してください。