6

VerizonのSongIDプログラムに慣れていない人は、VerizonのVCastネットワークからダウンロードできる無料のアプリケーションです。曲の途中で10秒間曲を聴き、このデータを全知のアルゴリズムの獣に送信します。この獣はそれを噛み砕き、すべてのID3タグ(アーティスト、アルバム、曲など)を送り返します。

最初の2つの部分と最後の部分は単純ですが、録音されたサウンドが送信された後の処理中に何が起こりますか?

サウンドファイル(どの形式?)を取り、それを(どのように?何で?)いくつかの重要な識別子(これらは何ですか?波動関数の通常の属性?位相/シフト/振幅など)を解析し、チェックする必要があると思いますデータベースに対して。

これがどのように機能するかについてオンラインで見つけたものはすべて、上記で入力したもののような一般的なものです。

audiotag.infoから

このサービスは、高度なオーディオ指紋技術と大規模な曲のデータベースを組み合わせた高度なオーディオ認識アルゴリズムに基づいています。オーディオファイルをアップロードすると、オーディオエンジンによって分析されます。分析中に、そのオーディオの「指紋」が抽出され、音楽データベースと比較することによって識別されます。この認識プロセスが完了すると、一致する確率を持つ曲に関する情報が画面に表示されます。

4

1 に答える 1

5

これらのサービスはすべて、クライアント側でサンプリングされたオーディオデータから「フィンガープリント」を取得し、それをサーバーに送信して、フィンガープリントデータベースと比較することで機能します。

Shazamの開発者の1人が、テクノロジーの仕組みについて非常に有益なホワイトペーパーを作成しました。これにより、必要なすべての情報が得られるはずです。

于 2010-05-21T19:24:36.903 に答える