3

最近、iPhone でShazam アプリを使い始めました。知らない人のために説明すると、このアプリは再生中の曲の小さな部分を聞いて曲を識別します。その精度と速度に驚いたので、少し調べてみることにしました。

ここで開発者の一人が書いた論文を見つけました。この論文では、開発者は、Shazam で使用されているフィンガープリンティング アルゴリズムについて詳しく説明しています。

お気に入りのプロジェクトとして、オーディオ プログラミングの経験を積むことができるように、自分の曲のフィンガープリンティング アプリケーションを作成したいと考えています。

オーディオ クリップまたは mp3 ソングの周波数、振幅、およびその他の特性をその期間にわたって抽出するのに役立つオーディオ ライブラリは何ですか?

私は .NET を使用していますが、他の言語のライブラリも使用できます。また、オープン ソース ライブラリと有料ライブラリの両方に問題はありません。プログラム的にオーディオ特性を確実に抽出できる限り、私は幸せです。

参照:
Shazam のしくみ
Shazam Journal Paper

4

3 に答える 3

2

NAudio を試してみてください。前もって探しているすべてのオーディオ分析が含まれているわけではありませんが、非常に拡張可能であり、.Net 言語を使用している場合は開始するのに適しています。

于 2009-08-15T22:10:10.677 に答える
1

オーディオ機能から始めるには、まずこのペーパーをお読みください。

多くのラボでは、オーディオ機能を抽出する独自のライブラリを開発しています。あなたはヤフィー、アウビオ、ジャウディオを見ることができます....

于 2013-07-22T06:01:13.717 に答える
-1

このffmpegライブラリは多くのオーディオ コーデックをサポートしていますが、インターフェースとの接続は非常に面倒です。

オーディオ プロパティを抽出するには、信号解析に適した適切なライブラリを検討する必要があります。たとえば、音声サンプルから周波数データを抽出するには、特に高速フーリエ変換 (FTT) が必要です。検索すると、そのトピックに関する多くの結果が得られます。

/編集: .NET の場合、インターフェイスがあると確信していffmpegます。.NET 用の信号解析ツールもあります。

于 2009-08-15T21:54:09.010 に答える