1

そこで、 ARモデルを EEG データに適合させ、AR 係数をデータのクラスタリングまたは分類の特徴として使用できることを読みました。

品質管理のステップとして、また説明の補助として、適合モデルによって生成/シミュレートされた時系列のタイプを視覚的に確認したいと考えました。これにより、K 平均法または分類のために何かを行っている場合に、プロトタイプ モデルを表示することもできます。

ただし、生成できるのはノイズだけです。

私が望むものに到達するためのステップは、大歓迎です。

section1 = data[88000:91800]
section2 = data[0:8000]
section3 = data[143500:166000]

section1 -= np.mean(section1)
section2 -= np.mean(section2)
section3 -= np.mean(section3)

プロット時: ここに画像の説明を入力

maxOrder = 20
model_one = AR(section1).fit(maxOrder, ic = 'aic', trend = 'nc') 
model_two = AR(section2).fit(maxOrder, ic = 'aic', trend = 'nc') 
model_three = AR(section3).fit(maxOrder, ic = 'aic', trend = 'nc') 

fake1 = arma_generate_sample(model_one.params,[1],1000, sigma = 1)
fake2 = arma_generate_sample(model_two.params,[1],1000,sigma = 1)
fake3 = arma_generate_sample(model_three.params,[1],1000,sigma = 1)

ax1.plot(fake1)
ax2.plot(fake2)
ax3.plot(fake3)

ここに画像の説明を入力

4

1 に答える 1

3

EEG データについて言うべき最も単純で多かれ少なかれ正しいことは、それが 1/f または「ピンク」分布を持っているということです。1/f 信号の興味深い点は、信号が非定常であり、どの次数の ARMA プロセスでも正しくモデル化できないことです。(1/f は、低周波数の変動が任意に大きいことを意味します。これは、任意に離れたポイントが相関したままであることを意味し、データが多ければ多いほど、検出できる相関がさらに離れます。ACF は有限に収束することはありません。また、信号の自己相関関数がそのスペクトル分布を完全に決定し、逆もまた同様であるため、スペクトル成分と ARMA のようなプロセスが非常に関連していることを認識することが重要です。2 つの関数は互いのフーリエ変換です)。

基本的にこれは、基本的な時系列統計を使用して行うことはすべて、理論に違反する巨大なハックになることを意味します. いくつかの有用な分類機能を生成することが実際にはうまくいかないという意味ではありませんが、それに応じて期待を調整してください...得られた結果はMohammadiらが得たものとまったく同じである可能性があります。適合度のチェック/レポートを行うことを気にしませんでした。

ウェーブレットまたは ARIMA プロセスを介して、1/f ノイズを直接モデル化する方法があります。

データによっては、単純な 1/f 分布からの偏差についても考慮する必要がある場合があります。たとえば、アルファ (10 Hz でスペクトル分布に大きな隆起が生じる)、筋肉ノイズ、電線ノイズ、心臓などのアーティファクトなどです。ビート (単純な 1/f スペクトルからの実質的な偏差も引き起こします -- 特に筋肉は、非常に特徴的な広帯域 ~ 白っぽいノイズを生成します)、およびまばたき (これは、モデル化されない大きなインパルス偏差を生成します)定常性を前提とする、または周波数ドメインで動作する任意の手法)。

これらの問題については、私の論文のセクション 5.3 で (参考文献とともに) より多くの議論がありますが、機械学習ではなく ERP のような分析を行うという文脈で述べています。

于 2015-05-27T23:58:30.033 に答える