問題タブ [audio-fingerprinting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - オーディオ マッチング (オーディオ フィンガープリンティング)
私は、ユーザーがマイクを介して自分の声を録音し、ストレージに保存して、特定のコンテンツ (連絡先など) にリンクできるようにする Android アプリを作成しています。後で、ユーザーがその声をもう一度呼び出すと、アプリはそれを保存されたオーディオ ファイルと比較し、声に一致するものを見つける必要があります。
私はたくさん検索し、これをオンラインで行ういくつかのライブラリを見つけました.EchoPrintは、録音されたオーディオからフィンガープリントを生成し、それをオープンソースサーバーに送信して結果を返します. しかし、私はこれをオフラインで行う必要があります。
そのようなライブラリを知っている人はいますか?
c# - メディア監視の実装 (ラジオ広告の監視など)
オーディオ監視ソフトウェアを開発したいのですが、たとえば、x ラジオ局で公開された特定の会社の広告の数を知りたいですか?
オーディオ ストリームを「リアルタイム」に分析し、広告のいずれかのバージョンがラジオで再生されるタイミングを検出する方法はありますか?
または、オーディオ フラグメントを x 秒ごとに分析するのが最善の方法です。これが正しい方法である場合、サンプル オーディオがオーディオのセグメントのみに含まれているかどうかを知るにはどうすればよいでしょうか (たとえば、20 分間のラジオを分析して true を返します)。そのオーディオ サンプルのスポット (広告) のプレーヤーの場合)
(私の英語で申し訳ありませんが、理解できることを願っています)
android - 2 つのオーディオ ファイルのオンライン比較
だから私は2つのオーディオファイルを比較したいと思っていました.1つはAndroidフォンにあり、もう1つはマイクを通して録音したいものとまったく同じです.
私は、それらはかなり基本的で類似したオーディオであり、かなり良い比較ができるはずだと感じています.少なくともいくつかある限り、ここでの精度についてはあまり心配していません.
Androidフォンでmusicgライブラリと互換性のあるwavファイルを録音しようとして一日中過ごした後、使用可能なwavファイルを簡単に録音することについて、ここで見たすべての例を理解できませんでした。2 つのオーディオ ファイルをアップロードして、類似性に基づいて値を取得できる、何らかのオンライン API またはリソースがあることを期待していました。
私はグーグルを試してみましたが、アーティストの音楽のような比較しか思いつきませんでした.
(残念ながら、FFT テクニックや独自のものを実装するために実際に理解するのに必要な時間の近くにはどこにもいないことに注意してください)
audio - 2 つのオーディオ ファイルを比較して、サウンドが似ているかどうかを確認する方法
ここに状況があります。いくつかのサウンドを含む 2 つの短いオーディオ ファイルがあるとします。最初のファイルには音声「こんにちは」(音声 1) があり、2 番目のファイルには誰かが話した「さようなら」(音声 2) があるとします。同じ人が話している「こんにちは」(オーディオ 3) を含む別のオーディオ ファイルがありますが、別の録音です。
オーディオ 3 がオーディオ 1 に似ていることを (スピーカーに関係なく) 検出するにはどうすればよいですか? 私はここで音声だけでなく音を扱っています。そのため、言葉の代わりに口笛の音を入れることもできます。
java - .wav ファイルの類似性をチェックする
.wav ファイルの類似性を比較しようとしています。そのためにGoogle musicgライブラリを使用しましたが、同様のサウンドに対して悪い解決策が得られました。同じ車の 2 つの車のモーター音を比較すると、録音は人間にとって非常に似ていますが、0.012468828 のような指紋類似度スコアが得られます。録音はマイクで行います。
私がその悪いスコアを得る問題は何ですか?
私が使う:
私の目標は、モーター音から車のモデルを見つけることができるプログラムを作成することです。
よりうまく機能している他のライブラリはありますか、それともオーディオフィンガープリントの問題ですか?
mysql - Dejavu - Python でのオーディオ フィンガープリンティング
https://github.com/worldveil/dejavu/blob/master/INSTALLATION.mdで要求されているように、すべての依存関係をインストールしました
Ubuntu 14.4 を使用しています。Linux は初めてです。
MYSQLDB をインストールし、「dejavu」というデータベースを作成しました。ターミナルでこのコマンドを実行すると、次のエラーが発生しました。
Dejavu がデータベースにリンクされているか、リンクされていないかが関係していると思います。
どんな助けでも大歓迎です。ありがとうございました。
pattern-matching - 2 つのオーディオ ファイルを比較するための FFT
私は、オーディオ ファイルの FFT を提供できる処理で minim ライブラリを使用しています。そのデータを使用して別のオーディオ ファイルと比較し、2 つのオーディオ ファイルの類似性を出力するにはどうすればよいですか?
signal-processing - オルゴールのオーディオフィンガープリンティング
私は、オルゴールで演奏された 4 つの異なる曲を認識する必要がある iOS アプリに取り組んでいます。echoprint の指紋コード生成 ( https://github.com/rexstjohn/echoprint-ios-sample ) を使用してみましたが、同じ曲の正確な録音を再生するとうまく機能しますが、音楽を再生すると機能しません。ボックス「ライブ」。オルゴールを演奏するさまざまなインスタンス間で発生するタイミング/音量などの違いは、明らかに、異なる曲として検出されます。
この特定のアプリケーションに最適なライブラリまたは手法を知っている人はいますか? あるいは、エコー プリントをハッキングして、このオルゴール アプリケーションをより寛容にする方法はありますか?