4

次の列を持つcsvファイルとして時系列データセットがあります-

ID,TIMESTAMP,MEASUREMENTS[10]

ID の場合、それらの測定が行われたときのタイムスタンプが関連付けられた複数の測定値があります。列の測定値には、10 個の測定値のリストが含まれています。1 つのレコード (特定のタイムスタンプに関連付けられている) での測定は、前のレコードに何らかの形で依存します。

例えば。データセットの:

ID,TIMESTAMP,MEASUREMENTS
1,0,[123,456,567.....]
1,100,[....]
1,350,[....]
2,0,[....]
2,200,[.....]

また、測定配列には、いくつかのインデックスで NaN が含まれています。最後に、各 ID に関連付けられたラベルがあります。これは、その ID の最後のタイムスタンプまでに実行された測定の結果です。私の目的は、このデータを HMM モデルに適合させ、同じ形式のテスト データセットのラベルを予測することです。このモデルをsklearn/hmmlearnの HMM モデルに適合させる方法は? sklearns のドキュメントはモデルの基準に達しておらず、パラメーターは説明されていません。

4

1 に答える 1

2

あなたの問題は、シーケンスのラベルを予測する必要があるためです。シーケンス分類ツールであるseqlearnを使用する必要があります。

また、HMM でデータをフィッティングするには、配列のリストを受け入れるため、前処理が必要になります。タイム スタンプと、各 ID に関連付けられた 3 つの測定値を時間の昇順で連結できます。これにより、ID ごとに長さ 33 のシーケンスが得られます。

さらにサポートが必要な場合はお知らせください。最近、あるプロジェクトで HMMLearn を使用しました。

于 2015-12-03T12:15:47.093 に答える