次のようなシステムによって生成されるデータのストリーム(3D位置など)があります。
(pos1, time1) (pos2, time2) (pos3, time3) ...
機械学習技術を使用して、特定のイベントの可能性を特定のデータ ストリームから推定 (または検出) したいと考えています。私がやった事:
- イベントがそのフレームで発生した場合は、すべてのフレームでデータに YES のタグを付けました。それ以外の場合は、NO に設定されます。
(pos1, time1, NO) (Pos2, time2, Yes) (pos3, time3, NO) ...(posK, timeK, Yes)...
- Lのようなウィンドウの長さを設定して、L個の連続したフレームを与えてモデルをトレーニングします。対応するタグは、そのウィンドウの最後の要素のタグによって設定されます。
(pos1、Pos2、pos3、NO) (pos2、Pos3、pos4、NO) (pos3、Pos4、pos5、NO) ... (posK-2、PosK-1、posK、YES) ...
- 最後に、このセットでモデルをトレーニングしました。
- テストでは、 L個の連続するフレームを連結し、モデルにこのデータ セットに対応するタグ (YES または NO など) を見つけるように依頼します。
「YES」よりも「NO」のほうがはるかに多いことがわかります。システムがほとんどアイドル状態にあり、イベントがないためです。そのため、トレーニングに影響を与えます。
ヒントを教えてください。1) この問題に最適な機械学習モデルのタイプはどれですか。2)現時点では、出力を「YES」または「NO」に分類していますが、いつでもイベントが発生する確率を知りたいです。どのようなモデルをお勧めしますか?
ありがとう