0

ギャップのあるヒストグラムを形成する個別の経験的データがあります。つまり、特定の値については観察が行われませんでした。ただし、実際には、これらの値が発生する可能性があります。散布図の図です。

ここに画像の説明を入力

私の質問は、ヒストグラムのビンを作成するために xaxis 値を補間する必要があるかどうかです。もしそうなら、ベストプラクティスとして何を提案しますか?

よろしく、

4

1 に答える 1

2

しないでください。

サンプルポイントが非常に多いため、分布が滑らかな場合に空のビンを取得する確率(p値)は非常に低くなります。それらが空である根本的な理由がいくつかあり、調査する必要があるかもしれません。私は2つの可能性を考えることができます:

  1. データは実際には離散的であり(おそらく、データ収集中に誰かが1つの重要な数値に丸められたか、ADCで量子化誤差が大幅に発生した)、単位変換によって不規則なギャップが発生しました。.12示されているように、およびから12,13への変換でさえ、実際にコンピューターの内部として表されている.13場合、この問題を引き起こす可能性があります。しかし、これは隣接するビンで2倍になる傾向があり、ギャップは一定の間隔で配置される傾向があるため、これが原因ではないかと思います。(たとえば、ベルヌーイコイントス実験の128回の試行が各データポイントに対して行われ、誰かが各シリーズのヘッドのパーセンテージを1%に最も近い値で記録した場合、1.28 /%を掛けて、実際の回復を試みることができます。ヘッドの数ですが、28個の空のビンがあります).12.11111111198

  2. あなたのディストリビューションには本物のローブがあります。空のビンごとに頻度が大幅に減少するため、この説明を支持します。

しかし、これらはあなた自身の調査のための提案を始めたばかりです。

于 2013-02-21T18:36:13.483 に答える