algorithm - Shazam / サウンドハウンドはどのように機能しますか?

Question

シャザムやサウンドハウンドがどのように機能するのかに興味があります。

どのようにして音声を録音し、一致する指紋のデータベースと非常に似ている指紋を作成するのでしょうか?

C/C++ でいくつかのソフトウェアの作成を開始しようとしていますが、使用するライブラリがわかりません。Microsoft の Speech SDK がいくつかあります。音声を分析して再生するプロセスをどこから「理解」し始めるか、いくつか提案はありませんか?

あなたが共有するすべてのヒントやアイデアに感謝します:]

score 3 · Accepted Answer

参照できる既存のソフトウェアがいくつかあります。

AudioDB : C++

Sonic Visualiser : SV ライブラリは Qt4 を使用して C++ で記述されています

1 に答える 1