python - Python: hmmlearn を介して複数の LARGE シーケンスを渡す

翻译自：https://stackoverflow.com/questions/40294642 2016-10-27T21:41:25.913

399 次

そのため、隠れマルコフモデルの非常に大きな特徴配列をトレーニングしようとしています: 700 x (400 x 4122)。ここで、400 x 4122 の各ミニ配列は、4122 の特徴を持つ 400 のタイムスタンプにわたって観測されたサンプルのシーケンスです。このようなシーケンスは合計 700 あり、連結するとメモリは最大 45 GB になります。私の質問は、このサイズの配列をどのように扱うのですか?

hmmlearn python パッケージでは、通常、次のように複数のシーケンスを操作します。

x1 -> 400x4122 シーケンス

x2 -> 別の 400x4122 シーケンス

...

xn -> 700 番目の 400x4122 シーケンス

X = np.concatenate(x1, x2, ..., xn)

長さ = [長さ (x1)、長さ (x2)、...、長さ (xn)]

モデル = GaussianHMM(n_component = 6, ...).fit(X, 長さ = 長さ)

つまり、シーケンスの配列全体を連結し、トレーニング関数にフィードする必要があります。ただし、連結された配列全体が大きすぎて処理できないため、一度に 1 つの 400x4122 シーケンスをフィードする方法があるかどうか疑問に思っていました。

前もって感謝します。

python - Python: hmmlearn を介して複数の LARGE シーケンスを渡す

0 に答える 0

Related

Reference