問題タブ [audio-fingerprinting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ios - Compare Two Audio(locally stored pre-recorded voice command and recorded from microphone in app) in iOS
In-app, I have to compare live recording from previously locally stored voice command if it matches(not only text but also identified person's voice) then perform necessary action.
1-match voice commands from the same person.
2-match command 's text.
I applied many ways but none are working as per my expectation.
First: use Speech to text Library like OpenEars,SpeechKit but these libraries convert only text from speech.
Result: Failed As My expectation
Second:(Audio Finger printing)
acrcloud Library : in this library, I record a command and stored that mp3file on acrcloud server and match with live recording(spoken by me) it doesn't match but when I play the same recording(recorded MP3 file of my voice ) which is uploaded to the acrcloud server then it matches. Result: Failed As My expectation
API.AI : in this library,it is like speech to text ,I stored some text command on his server and then anyone speaks the same command the result get success. Result: Failed As My expectation
Please Suggest me how to solve this problem for iOS Application
python - より大きなビデオ ストリームからのビデオ クリップに一致する Python スクリプト
ビデオ ストリームに含まれるビデオ クリップを識別するために使用できるスクリプトを Python で開発したいと考えています。
ビデオファイルとの比較を開始するためのPythonライブラリまたはサンプルスクリプトをいくつか提案してください
ありがとう
audio-fingerprinting - 協同音楽データベースを作成するためにオーディオ指紋アルゴリズムをどのように選択しますか?
共同音楽識別サービスを作成する必要があります。すべてのユーザーは、曲のフィンガープリントを作成し、メタ情報とともにサーバーに送信することができます。最初はサービス データベースは空で、音楽フィンガープリントが受信されるたびに、曲のメタ データが更新されます (別のユーザーが別の情報を送信した場合、サーバーは多数決に基づいてメタ データをフィンガー プリントに割り当てます)。同じ指紋)。
曲全体のフィンガープリントを計算する必要がありますが、一部から曲を特定する必要はありません。
フィンガープリントは 100% 正確であってはなりません。同じファイルが異なる圧縮率でエンコードされているだけで、2 つの曲ファイルが同じフィンガープリントを受け取ることができれば幸いです。低レベルのノイズ独立性はプラスになります。
曲の最初または最後の無音は問題になりません。標準の無音抑制アルゴリズムを使用して削除する必要があります (この場合、非常に正確な結果は必要ありません)。
http://echoprint.me/やhttps://acoustid.org/のようなオープンソース ライブラリがあることは知っていますが、これらのライブラリは私のニーズには過剰です。これにより、重いデータベースが作成されます。曲全体のフィンガープリントが重すぎない (数 kb) アルゴリズムが必要です。
使用できる最も単純で最速のアルゴリズムはどれですか?
ありがとうございます
android - Android: オーディオ マッチング (オーディオ フィンガープリンティング)
オーディオファイルを再生し、電話が同時に出力しているものを記録するAndroidアプリを作成しています。録音が完了すると、録音を再生された元のオーディオと比較し、それらが一致するかどうか、およびどの程度の確実性があるかを返します。
よく検索したところ、オーディオ フィンガープリンティング用のライブラリがいくつか見つかりましたが、それらは主に音楽の識別を目的としています。
この目的で使用できるライブラリはありますか? このためのカスタム アルゴリズムを作成することは理にかなっていますか?
python - SQL 経由で比較するために音声音声ファイルをハッシュ コーディングする手段を探しています
私は、初日に録音されたオーディオ ファイルと30日後に録音された別のオーディオ ファイルを比較するツールを開発してきました。私のトレーニングは言語学であり、このツールを使用して、独自の音声録音のデータベースをカタログ化、索引付け、および比較します。MusicBrainz や EchoNest などの商用レベルの API を認識していますが、このプロジェクトでは使用できません。すべてのファイルはローカルに保存する必要があり、オンライン データベースに投稿することはできません。
現在、各ファイルのスペクトログラムと、ほぼすべてのサウンド ファイルに変換できるバッチ コンバーターがあります。スペクトル アナライザーを使用してスペクトログラムを正確に一致させ (ハッシュ マップ オーバーレイなど)、結果を 96% の精度で一致させることができます。しかし、私のプロジェクトが大きくなるにつれて、この方法ではストレージのニーズが非常に高くなりすぎます。
私の考えでは、音声ファイルを同様のフレーム速度に調整できれば、音響データをハッシュ コード化し、音声ファイル全体やスペクトログラムではなく、単純な SQL テーブルにハッシュ文字列を格納できるはずです。ファイル全体をハッシュするのではなく、マッチングのために音響のみをハッシュします。私は Python (dejavu、libmo など) を介していくつかの行き過ぎた解決策を見つけましたが、コンピューターの専門家ではなく言語学者として、初心者が音声データをハッシュするためのコードを論争できるかどうかはわかりません
来週かそこら内にハッシュ値 (または別のチェックサム) を作成する方法を探しています。
java - Android: No such file or directory found エラー?
musicg API を使用してオーディオ マッチング分析を実行するために、オーディオの再生と録音を同時に行っています。アプリを実行するたびに次のエラーが発生します。
録音をファイルに保存し、それを getScore() メソッドに渡して、再生された元のオーディオ ファイルと比較し、一致するスコアを返そうとしています。以下は、MainActivity の関連コードで、エラーを示す行が太字で示されています。
編集1: