“audio-fingerprinting”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

2782 参照

ios - Compare Two Audio(locally stored pre-recorded voice command and recorded from microphone in app) in iOS

In-app, I have to compare live recording from previously locally stored voice command if it matches(not only text but also identified person's voice) then perform necessary action.

1-match voice commands from the same person.

2-match command 's text.

I applied many ways but none are working as per my expectation.

First: use Speech to text Library like OpenEars,SpeechKit but these libraries convert only text from speech.

Result: Failed As My expectation

Second:(Audio Finger printing)

acrcloud Library : in this library, I record a command and stored that mp3file on acrcloud server and match with live recording(spoken by me) it doesn't match but when I play the same recording(recorded MP3 file of my voice ) which is uploaded to the acrcloud server then it matches. Result: Failed As My expectation

API.AI : in this library,it is like speech to text ,I stored some text command on his server and then anyone speaks the same command the result get success. Result: Failed As My expectation

Please Suggest me how to solve this problem for iOS Application

2016-07-27T19:24:41.550

0 投票する

1 に答える

1326 参照

python - より大きなビデオストリームからのビデオクリップに一致する Python スクリプト

ビデオストリームに含まれるビデオクリップを識別するために使用できるスクリプトを Python で開発したいと考えています。

ビデオファイルとの比較を開始するためのPythonライブラリまたはサンプルスクリプトをいくつか提案してください

ありがとう

python python-2.7 video video-processing audio-fingerprinting

2016-09-21T08:16:19.113

0 投票する

1 に答える

1442 参照

audio-fingerprinting - 協同音楽データベースを作成するためにオーディオ指紋アルゴリズムをどのように選択しますか?

共同音楽識別サービスを作成する必要があります。すべてのユーザーは、曲のフィンガープリントを作成し、メタ情報とともにサーバーに送信することができます。最初はサービスデータベースは空で、音楽フィンガープリントが受信されるたびに、曲のメタデータが更新されます (別のユーザーが別の情報を送信した場合、サーバーは多数決に基づいてメタデータをフィンガープリントに割り当てます)。同じ指紋）。

曲全体のフィンガープリントを計算する必要がありますが、一部から曲を特定する必要はありません。

フィンガープリントは 100% 正確であってはなりません。同じファイルが異なる圧縮率でエンコードされているだけで、2 つの曲ファイルが同じフィンガープリントを受け取ることができれば幸いです。低レベルのノイズ独立性はプラスになります。

曲の最初または最後の無音は問題になりません。標準の無音抑制アルゴリズムを使用して削除する必要があります (この場合、非常に正確な結果は必要ありません)。

http://echoprint.me/やhttps://acoustid.org/のようなオープンソースライブラリがあることは知っていますが、これらのライブラリは私のニーズには過剰です。これにより、重いデータベースが作成されます。曲全体のフィンガープリントが重すぎない (数 kb) アルゴリズムが必要です。

使用できる最も単純で最速のアルゴリズムはどれですか?

ありがとうございます

audio-fingerprinting audioflinger

2016-11-23T15:23:36.620

0 投票する

1 に答える

815 参照

android - Android: オーディオマッチング (オーディオフィンガープリンティング)

オーディオファイルを再生し、電話が同時に出力しているものを記録するAndroidアプリを作成しています。録音が完了すると、録音を再生された元のオーディオと比較し、それらが一致するかどうか、およびどの程度の確実性があるかを返します。

よく検索したところ、オーディオフィンガープリンティング用のライブラリがいくつか見つかりましたが、それらは主に音楽の識別を目的としています。

この目的で使用できるライブラリはありますか? このためのカスタムアルゴリズムを作成することは理にかなっていますか?

android audio-fingerprinting

2016-12-06T07:16:14.317

0 投票する

0 に答える

739 参照

python - SQL 経由で比較するために音声音声ファイルをハッシュコーディングする手段を探しています

私は、初日に録音されたオーディオファイルと30日後に録音された別のオーディオファイルを比較するツールを開発してきました。私のトレーニングは言語学であり、このツールを使用して、独自の音声録音のデータベースをカタログ化、索引付け、および比較します。MusicBrainz や EchoNest などの商用レベルの API を認識していますが、このプロジェクトでは使用できません。すべてのファイルはローカルに保存する必要があり、オンラインデータベースに投稿することはできません。

現在、各ファイルのスペクトログラムと、ほぼすべてのサウンドファイルに変換できるバッチコンバーターがあります。スペクトルアナライザーを使用してスペクトログラムを正確に一致させ (ハッシュマップオーバーレイなど)、結果を 96% の精度で一致させることができます。しかし、私のプロジェクトが大きくなるにつれて、この方法ではストレージのニーズが非常に高くなりすぎます。

私の考えでは、音声ファイルを同様のフレーム速度に調整できれば、音響データをハッシュコード化し、音声ファイル全体やスペクトログラムではなく、単純な SQL テーブルにハッシュ文字列を格納できるはずです。ファイル全体をハッシュするのではなく、マッチングのために音響のみをハッシュします。私は Python (dejavu、libmo など) を介していくつかの行き過ぎた解決策を見つけましたが、コンピューターの専門家ではなく言語学者として、初心者が音声データをハッシュするためのコードを論争できるかどうかはわかりません

来週かそこら内にハッシュ値 (または別のチェックサム) を作成する方法を探しています。

python audio hash audio-fingerprinting

2016-12-31T15:13:08.830

0 投票する

1 に答える

4491 参照

java - Android: No such file or directory found エラー?

musicg API を使用してオーディオマッチング分析を実行するために、オーディオの再生と録音を同時に行っています。アプリを実行するたびに次のエラーが発生します。

録音をファイルに保存し、それを getScore() メソッドに渡して、再生された元のオーディオファイルと比較し、一致するスコアを返そうとしています。以下は、MainActivity の関連コードで、エラーを示す行が太字で示されています。

編集1：

java android audio-recording audio-fingerprinting

2017-04-06T03:01:57.303

問題タブ [audio-fingerprinting]

ios - Compare Two Audio(locally stored pre-recorded voice command and recorded from microphone in app) in iOS

python - より大きなビデオ ストリームからのビデオ クリップに一致する Python スクリプト

audio-fingerprinting - 協同音楽データベースを作成するためにオーディオ指紋アルゴリズムをどのように選択しますか?

android - Android: オーディオ マッチング (オーディオ フィンガープリンティング)

python - SQL 経由で比較するために音声音声ファイルをハッシュ コーディングする手段を探しています

java - Android: No such file or directory found エラー?

Reference

python - より大きなビデオストリームからのビデオクリップに一致する Python スクリプト

android - Android: オーディオマッチング (オーディオフィンガープリンティング)

python - SQL 経由で比較するために音声音声ファイルをハッシュコーディングする手段を探しています