問題タブ [anomaly-detection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 影響力のある観測のレバレッジ/ハットバリューを見つける
2 つのデータセット: 1 つには明らかに影響力のある観測があり、もう 1 つにはありません。ただし、帽子の値を見つけて経験則テストを使用すると、最初の値は元に戻すレバレッジを示しておらず、2 番目の値は示しています。
最後の観測 (5) に注目してください。ハット値が 0.94 で、ハット値の平均の 2 倍または 3 倍以上であるため、影響力があるとフラグが立てられます。
最後の観察結果を見てください。明らかに影響力がありますが、ハット値は平均の 2 倍以下です。
背景:データセットは経時的な値です。頻繁に値が不安定になります (異常、スパイク、リセット、ゼロになる)。私の考えは、for ループを使用して、5 つのデータ ポイントごとに回帰を計算することです。異常が発生した場合は、それを修正するためのロジックを記述できます。
machine-learning - データ転送の異常検出
私は異常検出モデルに取り組んでおり、データ転送の異常を特定するのに助けが必要です。例: 従業員が VPN を使用して接続されており、次のデータ使用量がある場合:
従業員が範囲内で送信または受信していて、突然ジャンプしたため、行 3 に異常としてフラグを立てたいと考えています。ここ数日で送受信されたバイト数を追跡したいと思います。つまり、ここ数日で彼の行動がどのように変化したかということです。