ずっと気になっていたのでただの好奇心です。アプリケーション Shazam はどのように機能しますか? 私はそれを使用する方法を知っています、私はプログラミングの観点から話しています。アプリケーションはどのように曲の一部を聞いて結果を表示するのでしょうか? 明らかに、データベースから曲の情報を受け取りますが、そのデータベースにある人が知っているすべての曲を誰かが入力できる方法はありません。また、Shazam が常に更新されないのはなぜですか? 新しい曲は常にリリースされていますが、Shazam にはすでに未来の曲がプログラムされているようでした。これは私には気が遠くなるようなものであり、これがどのように機能するかを正確に知りたいだけです。これはヘルプの質問ではないことはわかっていますが、誰かが明確にしてもらえますか? ありがとう!
3105 次
2 に答える
2
Shazam はフーリエ変換からのみ開始します (ほぼすべてのオーディオ処理がこの方法で機能するため、これは驚くべきことではありません)。
必要に応じて、Avery Wang の元の論文を読むことができます。彼は Shazam アルゴリズムの発明者です。これは最近傍手法として説明するのが最も適切だと思います。そのため、「データ マイニング手法、第 3 版」の第 9 章に例として含めました。
そこで私たちが何を言おうとしているのか興味があるかもしれません (http://www.amazon.com/Data-Mining-Techniques-Relationship-Management/dp/0470650931/ref=pd_sim_b_5)。
于 2012-07-24T15:52:50.310 に答える
0
diciu が投稿したリンクについて、彼らはあまり語っていません。
アルゴリズムはフーリエ波に基づいており、数学関数を調和関数の線形和として表現できます。この変換により、時間から周波数へのマッピングが可能になります。これは、音声認識を作成するために必要なものです。
Shazaam がフーリエ変換に関する特許を持っているとは信じがたいです。しかし、「第 2 のシャザム」を構築しようとすると、おそらく失敗するでしょう。
于 2012-07-24T06:10:02.920 に答える