1

私はこのタスクに頭を悩ませようとしていますが、これを行うための標準的な方法や、役立つライブラリがあるかどうか疑問に思っています。

特定のイベントは、いくつかのデータソースS1...SNで追跡および計測されます。記録される情報は、イベントタイプとタイムスタンプです。同じタイプのイベントが連続して複数発生する場合もあれば、断続的に発生する場合もあります。「欠落」イベントが発生する可能性があります。つまり、ソースの1つがそれを見逃した場合、およびその逆の場合、ソースが「誤検知」を導入した場合です。通常、異なるソースでの同じイベントの観測には時間差があります。この時間差には、ソースの物理的な場所によって一定の要素がありますが、ネットワークの遅延やその他の要因によって変化する要素が含まれる場合もあります。

すべてのソースでの観測を単一の「観測イベント」にグループ化し、欠落イベントと誤検知を検出できるようにするために使用する必要がある最適な最大時間間隔を見つけるアルゴリズムを見つける必要があります。

解決策が本当にアルゴリズムではなく統計分野のどこかにあるのだろうかと思います。任意の入力をいただければ幸いです。

4

1 に答える 1

1

あなたが出席システムを構築しているように聞こえます:-)私が現在構築しているシステムでは、この種のグループ化の観察も必要です。私の場合、パスリーダーの前にパスリーダーを置いて出席を登録するパスを持っている従業員がいます。最初に、システムは1人の従業員からすべての出席者を選択します。その後、登録時間順に並べて、1日の箱に入れます。すべての登録は、開始か停止かで評価されます。最初の登録が開始登録の場合、システムは最大12時間後に停止登録を検索します。ストップが来ない場合はストップが挿入されます。計画がわかっている場合は、追加のインテリジェンスを導入できます。おそらく統計を使用することもできますが、私の場合はアルゴリズムの問​​題でした。

于 2010-11-30T18:17:33.723 に答える