私はプロジェクトに取り組んでおり、ユーザーのキーストローク時間データのサブセットを持っています。これは、ユーザーがn回試行することを意味し、これらの記録された試行時間データをさまざまな種類の分類アルゴリズムで使用して、将来のユーザーの試行で次のことを確認します。ログインプロセスは、ユーザーまたは他の人によって行われます。(簡単に言えば、これはバイオメトリクスだと言えます)
ユーザーログインの試行プロセスは3回ありますが、もちろんこれは無限データのサブセットです。
これまでは簡単な分類問題でしたが、WEKAを使用することにしましたが、私が理解している限り、分類アルゴリズムにフィードするために偽のデータを作成する必要があります。ユーザーの測定試行回数は1で、偽のデータは0になります。
いくつかの最適化アルゴリズムを使用できますか?または、この偽のデータを作成して最小の誤検知を取得する方法はありますか?
ありがとう