私はTunaticやMidomiに似たものを構築したいと考えており (何をするかわからない場合は試してみてください)、どのアルゴリズムを使用する必要があるのか考えています。このようなアプリケーションの仕組みについて私が持っている考えは、次のようなものです。
- いくつかの曲を含む大きなデータベースを持っている
- 1の各曲について、品質/ビットレートを下げ(たとえば64kbpsに)、サウンドの「ハッシュ」を計算します
- 識別したい音楽の音/抜粋を持っている
- 3.の曲の品質/ビットレートを下げ(再び64kbpsに)、サウンドの「ハッシュ」を計算します
- 4.サウンド ハッシュが2.サウンド ハッシュのいずれかにある場合、一致した音楽が返されます
環境ノイズとエンコードの違いにより、品質/ビットレートを下げることを考えました.
私はここで正しい軌道に乗っていますか?誰かが私に特定のドキュメントや例を提供できますか? みどりちゃんも認識しているようでhum's
、すごい迫力です!彼らはどのようにそれをしますか?
サウンドハッシュは存在しますか、それとも私が作ったものですか? もしそうなら、どうすればそれらを計算できますか? さらに重要なことに、が入っているかどうかを確認するにはどうすればよいchild-hash
ですfather-hash
か?
Python (おそらく組み込みモジュール) または PHP を使用して同様のシステムを構築するにはどうすればよいでしょうか?
いくつかの例 (できれば Python または PHP) は大歓迎です。前もって感謝します!