シャザムやサウンドハウンドがどのように機能するのかに興味があります。
どのようにして音声を録音し、一致する指紋のデータベースと非常に似ている指紋を作成するのでしょうか?
C/C++ でいくつかのソフトウェアの作成を開始しようとしていますが、使用するライブラリがわかりません。Microsoft の Speech SDK がいくつかあります。音声を分析して再生するプロセスをどこから「理解」し始めるか、いくつか提案はありませんか?
あなたが共有するすべてのヒントやアイデアに感謝します:]
シャザムやサウンドハウンドがどのように機能するのかに興味があります。
どのようにして音声を録音し、一致する指紋のデータベースと非常に似ている指紋を作成するのでしょうか?
C/C++ でいくつかのソフトウェアの作成を開始しようとしていますが、使用するライブラリがわかりません。Microsoft の Speech SDK がいくつかあります。音声を分析して再生するプロセスをどこから「理解」し始めるか、いくつか提案はありませんか?
あなたが共有するすべてのヒントやアイデアに感謝します:]
参照できる既存のソフトウェアがいくつかあります。
AudioDB : C++
水銀リポジトリ: http://code.soundsoftware.ac.uk/projects/audiodb/
Sonic Visualiser : SV ライブラリは Qt4 を使用して C++ で記述されています