離散分布関数のフィッティングに問題があります (特に負の二項分布を使用しています)。ここに私の設定があります: 私は未知の寿命を持つ受信アイテムのソースを持っています. 毎日、期限切れになるものもあります (初日に大部分、2 日目にはさらに多くなるなど)。着信アイテムの既存のソース (ソースは 180 日より古い) の場合、負の二項分布を使用して新しいアイテムの寿命を許容誤差までモデル化することができました (MLE - 最尤推定を使用)。
私の問題は、入ってくるアイテムの新しいソースから始まります。短期間 (たとえば 5 ~ 7 日後) のアイテムの生涯分布を推定したいと考えています。MLE を適用しようとすると、平均値が大幅に低くなります (つまり、30 ではなく 3)。これは、最終日 (7 日目) の質量が実際には 1-CDF(6) (過去 6 日間の累積分布関数) であり、実際には生きている項目も含まれていることを MLE が理解できないためだと思います。
初期のデータ値と他の値の質量の合計のみに基づいて離散分布を適合させる良いアプローチはありますか? そのための最適化関数を作成して、前の 6 日間だけに重みを付けることができますが、最適なパフォーマンスが得られないと感じています。
理論の説明は問題ありませんが、特定の関数またはライブラリに対処できる場合は、Matlab、R、Python、および C# で作業できます。