0

それを解決するエレガントな方法が見つからない問題に遭遇しました...

オーディオ入力を監視し、音響指紋に基づいて一致を割り当てようとするアプリケーションがあります。

アプリケーションは数秒ごとにサンプルを取得し、ルックアップを実行してタイムスタンプ付きの結果をデータベースに保存します。

フィンガープリンティングは常に正確であるとは限らないため、「間違った」アイテムが割り当てられることがあります。したがって、データは次のようになります。

timestamp    foreign_id        my comment
--------------------------------------------------
12:00:00            17
12:00:10            17
12:00:20            17
12:00:30            17
12:00:40           723        wrong match
12:00:50            17
12:01:00            17
12:01:10            17
12:01:20          None        no match
12:01:30            17
12:01:40            18
12:01:50            18
12:02:00            18
12:02:10            18
12:02:20            18
12:02:30           992        wrong match
12:02:40            18
12:02:50            18

そこで、データを定期的に「クリーンアップ」する方法を探しています。

これを達成するための良い方法を想像できる人はいますか? 上記の例では、foreign-id723のエントリを17などに修正する必要があります。また、可能であれば、考慮すべきエントリの数に関するしきい値を指定します。

私の質問がこのように十分に明確かどうかはわかりませんが、どんな入力も歓迎します!

4

1 に答える 1

0

外部IDがデータベースに何度もあることを確認してから、それらの時間が近いかどうかを確認しますか?

データを使用するときに「悪い」データを無視しないのはなぜですか?

于 2013-06-18T15:54:14.950 に答える