そのため、隠れマルコフ モデルの非常に大きな特徴配列をトレーニングしようとしています: 700 x (400 x 4122)。ここで、400 x 4122 の各ミニ配列は、4122 の特徴を持つ 400 のタイム スタンプにわたって観測されたサンプルのシーケンスです。このようなシーケンスは合計 700 あり、連結するとメモリは最大 45 GB になります。私の質問は、このサイズの配列をどのように扱うのですか?
hmmlearn python パッケージでは、通常、次のように複数のシーケンスを操作します。
x1 -> 400x4122 シーケンス
x2 -> 別の 400x4122 シーケンス
...
xn -> 700 番目の 400x4122 シーケンス
X = np.concatenate(x1, x2, ..., xn)
長さ = [長さ (x1)、長さ (x2)、...、長さ (xn)]
モデル = GaussianHMM(n_component = 6, ...).fit(X, 長さ = 長さ)
つまり、シーケンスの配列全体を連結し、トレーニング関数にフィードする必要があります。ただし、連結された配列全体が大きすぎて処理できないため、一度に 1 つの 400x4122 シーケンスをフィードする方法があるかどうか疑問に思っていました。
前もって感謝します。