問題タブ [audio-fingerprinting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1134 参照

android - Android 煙警報音を検出する方法

マイクを使って音を聞く必要があるアプリを開発する必要があります。また、煙警報音が検出されるたびに、アプリは火災警報があることをユーザーに通知する必要があります。そのために、私は2つの可能な解決策を考えています

1:) Speech To Text 認識エンジンを使用して煙警報音をテキストに変換し、そのテキストを保存します。次回、煙警報音が受信されるたびに、同じ Speech To Text 認識エンジンがそれを関連するテキストに変換し、そのテキストが保存されているテキストと一致する場合、それは警報音であると想定します。

2:) アラーム音を保存し、波形を比較して録音した音波と保存音を一致させます。私はこれらの分野の専門家ではないので、これは単なる私の仮定です。

これまでのところ、このサウンド マッチングの手法は、audio fingerprintingつまり、各オーディオには個別のフィンガープリントがあり、2 つのオーディオのフィンガープリントを一致させることができれば、それらは同一であると見なされることによって行われることがわかりました。

そのために、最近次のリンクを見つけました

http://www.royvanrijn.com/blog/2010/06/creating-shazam-in-java/

http://masl.cis.gvsu.edu/2012/01/25/android-echoprint/

https://code.google.com/p/musicg/

これは私の問題の解決策に近いと思われます.私はまだこれらすべてを把握しようとしていますが、皆さんからの助けがあれば大歓迎です.

0 投票する
1 に答える
1465 参照

python - Dejavu ライブラリを使用してオーディオ フィンガープリンティングを行い、フォルダー内のすべてのファイルを認識するためのループ

Python でオーディオ フィンガープリンティングと認識を行う Dejavu ライブラリを使用した経験のある人はいますか? 正常に動作していますが、私が興味を持っているのは、これまでのところ、次を使用して一度に1つのファイルを認識できることです。

フォルダー内のすべてのファイルに対して上記の印刷コマンドを実行するループを作成する方法と場所を知っている人はいますか? ここのどこかにループを作成する必要があると思います:

https://github.com/worldveil/dejavu/blob/master/dejavu/recognize.py

glob モジュールで行う必要があることはわかっていますが、私は初心者なので、そのループでどこに配置すればよいかわかりません。そのため、認識のために正確なファイルを求めるプロンプトが表示されません!

0 投票する
2 に答える
1661 参照

java - 音声指紋を使用して音声タグを取得する方法

すべての id3 タグが null のオーディオ ファイルがあります。音響指紋を抽出し、オンライン サービスを使用して id3 タグを取得したいと考えています。

Javaでそれを行うにはどうすればよいですか?音声指紋を渡してタグを返すことができるオンライン サービスはありますか?

0 投票する
1 に答える
926 参照

android - 音声アンドロイドでユーザーを認識

友達、

誰かの声を認識するアプリを作成しようとしています。

考えられるシナリオは次のとおりです。

1) ユーザー (ジョン) が初めてアプリを起動すると、アプリはジョンに音声パスワード (例: 「ロック」) を作成するように求めます。2) ジョンがアプリを 2 回目に起動すると、「ロック」と表示されます --->成功! 3) メアリーはジョンの電話でアプリを起動し、「ロック」と言います --> アクセスが拒否されました!

基本的には声でユーザーを認識します。

これについてどうすればよいかについて何か提案はありますか?私はAndroidが初めてです。すでにこれを行っている publick api はありますか?

Android の SpeechRecognizer クラスは音声を認識できますが、誰が話しているかを判断することはできません。私が必要としているのはオーディオ フィンガープリントです。これは、SpeechRecognizer では実行できないことです (私が知っている限りでは)。

0 投票する
0 に答える
1036 参照

ios - iOSで拍手を検出する方法は?

拍手の音が認識されたときにアクションを実行するアプリの作成に取り組んでいます。AVAudioRecorder からの平均電力とピーク電力を単純に測定することを検討しましたが、これは問題なく機能しますが、他の音がある場合は、多くの誤検知が報告されます。他のオーディオの再生中にこれを機能させるには、ある種のオーディオフィンガープリンティングが必要だと思います。これは SO で以前によく尋ねられたことを知っていますが、ほとんどの回答は「FFT​​ を使用する」という行に沿って何かを言い、その人は「オーケー!」と言います。しかし、明確な説明は与えられておらず、FFTを使用して音を正しく識別する方法はまだわかりません。

誰かが明確に説明したり、別のチュートリアルを引用したり、オーディオフィンガープリンティングを使用して音を識別できるライブラリへのリンクを投稿したりできますか?

ありがとう!

0 投票する
1 に答える
197 参照

java - Android /java echonest ファイルのアップロード エラー rr

そのため、分析のためにechonestサーバーにファイルをアップロードする方法を見つけようとしていましたが、実際には何も起こりません:Track track = echoNest.uploadTrack(file,true);

インターネットで検索中に同様の問題に遭遇しましたが、解決策に出くわすことができませんでした。

http://archive-com.com/page/3694036/2014-02-11/http://developer.ehonest.com/forums/thread/365

http://developer1072.rssing.com/chan-22893681/all_p31.html#item617

http://developer.ehonest.com/forums/thread/1624

ここに私が受け取っているエラーがあります

0 投票する
0 に答える
145 参照

matlab - オーディオ信号を Barks バンドに分割する

matlabで次の手順を適用したい

1) 音声データを読み込む

2) そのデータに窓関数を適用する

3) 窓関数の結果に fft を適用する

4) fftのパワースペクトルを作る

5) パワー スペクトルを Barks バンドに分割する

正しい波形が得られません。スペクトルを描画してから、barks バンドに分割します。