3

私は、デバイスがいつオンになるかを表す時間 T のリストを持つ一連のデバイスをそれぞれ持っています。

デバイス A : [月 16:03、月 15:59、水 16:05、... n]

たとえば、翌日、人が平均 T+/-5 分でスイッチをオンにした場合、その時間と平均 T 値との間に強い関連性がある可能性があります。パターンがあり、日が経つにつれて構築できると言えます。値のない日 (スイッチがオンになっていない) がある場合。失敗すると、信頼が低下する可能性があります。問題の 1 つは、欠落している 1 日分のデータを考慮する必要があることです。信頼度がしきい値を下回った場合、パターンは存在しないと言えます。

私は単純な作業バージョンを作成しました (ミスを考慮していません) が、イベントが毎日発生するかどうかを評価および検出するための最良の方法をより優れた心が検討することにもっと興味があります。私はこれにアプローチするエレガントで美しい方法に興味があるので、これがこれに最適な場所だと思いました. このようなパターンを解決するために存在するより良い統計モデルはありますか? ありがとうございました

4

2 に答える 2

4

かなり明白なことの 1 つは、(fft を使用して) タイミング データのパワー スペクトルを生成し、重要なピークを探すことです。生理周期が 1 日のシグナルがある場合は、何かが毎日起こっていることがわかります。期間が 7 日のシグナルもある場合は、週単位のコンポーネントがあることがわかります。おそらく、週末には同じ動作がありません。

これは古典的な定量的アプローチです。また、より現代的で構造化されていないアプローチを試してみることもできます。おそらく、何らかの方法でパターンを認識できるようにニューラル ネットワークをトレーニングしますか? これらを組み合わせてはならない理由はありません。パワー スペクトルは、データをより構造化された形式でネットに提示するために使用されるパラメータ (周期) を提供する場合があります (たとえば、適切な周期を法として時間を取ることによって)。

最後に、文献検索も行い、他の人が何をしたかを確認します。グーグルで遊んでみると、「一時的なパターン検出」が適切なフェーズの 1 つになるようです。

ps また、バリエーションの検出をパターンの検出から分離します。まず、パターンの検出に取り組みます。うまく機能しているのは一度だけです。「毎日5分早く」などに拡張することを考えます。単純に始める方が良いという理由もありますが、そのような修正が重要であると確信していないためです。ほとんどの人は、毎日 5 分前に何かを一貫して行うわけではありません。そうしないと、夜は忙しくなります... 私たちは生まれつき周期的であるため、最初に周期を探し、それらが重要であるという証拠がある場合にのみ線形変動を検討します。 .

pps 統計は、特定の仮説の証拠を評価する際にのみこれに関与します。それはパターンマッチング/パターン検出に関するものであり、これらのタグを追加することでより多くの返信を得ることができます.

于 2012-04-21T19:16:21.210 に答える
2

あなたの定義によると、イベントeが 24 時間ごとに 10 分間隔で発生し、その確率が特定のしきい値よりも高い場合、パターンが存在します。これは日の出の問題に似ています。あなたの場合、ブールの毎日のイベントは日の出ではなく、予想される間隔内のイベントeの発生です。

事象eが明日発生する確率は、継承の法則に従って計算できます。あなたの定義によれば、この値が指定されたしきい値よりも高い場合、パターンが存在します。

于 2012-04-22T19:16:28.383 に答える