それを解決するエレガントな方法が見つからない問題に遭遇しました...
オーディオ入力を監視し、音響指紋に基づいて一致を割り当てようとするアプリケーションがあります。
アプリケーションは数秒ごとにサンプルを取得し、ルックアップを実行してタイムスタンプ付きの結果をデータベースに保存します。
フィンガープリンティングは常に正確であるとは限らないため、「間違った」アイテムが割り当てられることがあります。したがって、データは次のようになります。
timestamp foreign_id my comment
--------------------------------------------------
12:00:00 17
12:00:10 17
12:00:20 17
12:00:30 17
12:00:40 723 wrong match
12:00:50 17
12:01:00 17
12:01:10 17
12:01:20 None no match
12:01:30 17
12:01:40 18
12:01:50 18
12:02:00 18
12:02:10 18
12:02:20 18
12:02:30 992 wrong match
12:02:40 18
12:02:50 18
そこで、データを定期的に「クリーンアップ」する方法を探しています。
これを達成するための良い方法を想像できる人はいますか? 上記の例では、foreign-idが723のエントリを17などに修正する必要があります。また、可能であれば、考慮すべきエントリの数に関するしきい値を指定します。
私の質問がこのように十分に明確かどうかはわかりませんが、どんな入力も歓迎します!