5

かなり分かりやすい質問があります。

一連のデータがあり、このデータが標準正規分布にどの程度適合しているかを推定したいと考えています。そのために、コードから始めます。

[f_p,m_p] = hist(data,128);
f_p = f_p/trapz(m_p,f_p);

x_th = min(data):.001:max(data);
y_th = normpdf(x_th,0,1);   

figure(1)
bar(m_p,f_p)
hold on
plot(x_th,y_th,'r','LineWidth',2.5)
grid on
hold off

図 1 は次のようになります。

ここに画像の説明を入力

ベルの形は確認できますが、フィット感が非常に悪いことが簡単にわかります。したがって、主な問題は私のデータの分散にあります。

私のデータビンが所有すべき適切なオカレンス数を見つけるために、私はこれを行います:

f_p_th = interp1(x_th,y_th,m_p,'spline','extrap');
figure(2)
bar(m_p,f_p_th)
hold on
plot(x_th,y_th,'r','LineWidth',2.5)
grid on
hold off

これにより、次の図が得られます。:

ここに画像の説明を入力

したがって、問題は次のとおりです。図2のように、データブロックをガウス分布に一致するようにスケーリングするにはどうすればよいですか?

注意

1 つの点に焦点を当てたいと思います。データに最適な分布を見つけたいわけではありません。問題です。私のデータから始めて、最終的にその分布がガウス分布に合理的に適合するように操作したいと思います。

残念ながら、現時点では、このデータの「フィルター」、「変換」、または「操作」を実行する方法についての本当の考えはありません。

どんなサポートも大歓迎です。

4

3 に答える 3

4

おそらくあなたが興味を持っているのは、ランクベースの逆正規変換です。基本的に、最初にデータをランク付けしてから正規分布に変換します。

rank = tiedrank( data );
p = rank / ( length(rank) + 1 ); %# +1 to avoid Inf for the max point
newdata = norminv( p, 0, 1 );
于 2013-03-21T15:29:17.593 に答える
2

あなたがやろうとしていることは、一連のデータがどれほどランダムであるかを見つけようとする問題と一致しているようです。Supergaussian pdfは、ガウス分布よりもゼロ付近(または平均値)が大きい確率を持つものであり、その結果、あなたの例のように、より「鋭いピーク」になります。このタイプの分布の例は、ラプラス分布です。サブガウス pdf は逆です。

データセットのガウス分布への近さの尺度は、多くの方法で与えることができます...多くの場合、これは 4 次モーメント、尖度 ( http://en.wikipedia.org/wiki/Kurtosis - MATLAB 関数kurt)、または negentropy ( http://en.wikipedia.org/wiki/Negentropy )などの情報理論的尺度。エラーが 4 乗されるため、異常値が多数ある場合、尖度は少し危険です。

「4 次モーメント」という用語が分からない場合は、統計の教科書を読んでください。

独立成分分析 (ICA) は核となる概念であるため、これらの比較とランダム性 (ガウス性) の他のいくつかの測定値の比較が、独立成分分析 (ICA) に関する多くのテキストで提供されています。これに関する優れたリソースは、Hyvarinen と Oja による本 Independent Component Analysis です - http://books.google.co.uk/books/about/Independent_Component_Analysis.html?id=96D0ypDwAkkC

于 2013-03-21T14:44:42.037 に答える
1

この質問、またはあなたの他の最近の同様の質問が正確に何を尋ねているのか、私は本当に理解することができませんでした。

おそらく、正規分布のデータがあり、平均0と標準偏差1で正規分布させたいですか?

muその場合は、データから減算し、それをで除算しますsigma。ここmuで、はデータの平均であり、sigmaはその標準偏差です。元のデータが正規分布している場合、結果は平均0と標準偏差1で正規分布しているデータになります。

zscoreStatistics Toolboxには、これを正確に行うための関数があります。

しかし、おそらくあなたは何か他のものを意味しましたか?

于 2013-03-21T14:40:01.293 に答える