1

私は統計の世界に精通していないので、これが誰かにとって簡単になることを願っています。スキルが不足しているため、このトピックに関する正しい検索用語を見つけるのが非常に難しく、検索で答えを逃した可能性があります。とりあえず。たとえばCPU使用率など、データの配列を調べています。たとえば、1時間のコアでのCPU使用率に関する1秒の時間間隔を含むデータセットで、最初の30分が0%で、次の30分が100%。今のところ、私が考えることができる1つのデータポイントでわかるのは平均値だけです。これは50%であり、この場合はまったく役に立ちません。また、別のケースは、使用状況グラフが波のようで、0〜100の間で均等に上下にバウンドしているにもかかわらず、平均が50%である場合です。このデータをキャプチャするにはどうすればよいですか?ありがとう。

4

1 に答える 1

1

私があなたの質問を理解しているなら、それは実際にはプログラミングの質問というよりも統計の質問です。つまり、可能な限り少ない変数で人口曲線をキャプチャするための最良の方法は何ですか?

まず、ほとんどの標準的な統計の仮定は、システムが多かれ少なかれ安定していることを意味します(ただし、システムが不安定な場合、得られる数値は無意味であるため、通知されます)。

統計的に知る必要がある主な指標は、平均、母集団のサイズ、および標準偏差です。これから、母集団曲線を定義する大まかなベル曲線を計算し、標準偏差のスケールに基づいて曲線の精度を知ることができます。

これにより、標準のベル曲線の3つの変数スキーマが得られます。

さらに詳しく知りたい場合は、計算フィールドであるCpk、Ppkを追加できます。

それ以外の場合は、ケースバイケースで処理するのが最適な非線形回帰とカーブフィッティングを行う必要があります(プログラミングには適していません)。

Cp、Cpk、Pp、およびPpkの計算については、次のサイトを確認してください。http:
//www.qimacros.com/control-chart-formulas/cp-cpk-formula/

http://www.macroption.com/population-sample-variance-standard-deviation/

于 2012-07-23T21:19:42.577 に答える