python - SQL 経由で比較するために音声音声ファイルをハッシュコーディングする手段を探しています

Question

私は、初日に録音されたオーディオファイルと30日後に録音された別のオーディオファイルを比較するツールを開発してきました。私のトレーニングは言語学であり、このツールを使用して、独自の音声録音のデータベースをカタログ化、索引付け、および比較します。MusicBrainz や EchoNest などの商用レベルの API を認識していますが、このプロジェクトでは使用できません。すべてのファイルはローカルに保存する必要があり、オンラインデータベースに投稿することはできません。

現在、各ファイルのスペクトログラムと、ほぼすべてのサウンドファイルに変換できるバッチコンバーターがあります。スペクトルアナライザーを使用してスペクトログラムを正確に一致させ (ハッシュマップオーバーレイなど)、結果を 96% の精度で一致させることができます。しかし、私のプロジェクトが大きくなるにつれて、この方法ではストレージのニーズが非常に高くなりすぎます。

私の考えでは、音声ファイルを同様のフレーム速度に調整できれば、音響データをハッシュコード化し、音声ファイル全体やスペクトログラムではなく、単純な SQL テーブルにハッシュ文字列を格納できるはずです。ファイル全体をハッシュするのではなく、マッチングのために音響のみをハッシュします。私は Python (dejavu、libmo など) を介していくつかの行き過ぎた解決策を見つけましたが、コンピューターの専門家ではなく言語学者として、初心者が音声データをハッシュするためのコードを論争できるかどうかはわかりません

来週かそこら内にハッシュ値 (または別のチェックサム) を作成する方法を探しています。

python - SQL 経由で比較するために音声音声ファイルをハッシュ コーディングする手段を探しています

0 に答える 0

Related

Reference

python - SQL 経由で比較するために音声音声ファイルをハッシュコーディングする手段を探しています