“audio-fingerprinting”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

2658 参照

python - 音声指紋照合 - 最も近い一致を見つける

fpcalc を使用して、サウンドクリップからオーディオフィンガープリントを取得しています。それらは次のようになります。

サウンドを録音して指紋を付けると、次のようになります。

今、データベースを見て、次のようにレーベンシュタイン距離を使用して最も近い一致を見つけます。

私が与えたサンプルとサウンドがうまく一致しないため、良い結果が得られません。

私はこれを正しくやっていますか？より良い指紋ライブラリはありますか? 私はpythonまたはrubyを使用しています..

口笛を鳥の鳴き声に合わせようとしています。

python audio-fingerprinting

2013-07-23T19:31:32.617

0 投票する

2 に答える

726 参照

c# - 録音の品質を効率的にチェックする方法

サーバー側のプロセスの 1 つから入ってくるライブの制御されていない録音からのさまざまな wave ファイルがあり、それらのほとんどは全体を通して良好な明瞭な音声を持っています。ただし、文字化けしたり、ノイズが発生したり、音声の音量が十分に大きくない場合があります。C# を使用して録音が「良い」品質と見なされるかどうかを判断する効率的な方法はありますか?

既知の良好な録音のスペクトグラムを取得し、悪い録音のスペクトログラムと比較することを考えましたが、録音の音声は毎回異なるため、うまくいかない可能性があります。Bass.Net や NAudio などのライブラリを調べましたが、オーディオ処理は私の専門分野ではありません。

オーディオフィンガープリントの比較を試すこともできますが、これがどのように機能するかは完全にはわかりません。誰かが、オーディオフィンガープリントハッシュとレーベンシュタイン距離アルゴリズムを使用して 2 つのオーディオファイルを比較し、2 つのオーディオファイル間の類似度を見つけようとしているのを見ました。オーディオフィンガープリンティングによって生成されたハッシュが類似のオーディオファイル間で類似していない限り、この方法は機能しません。

私が考えたもう 1 つの考えは、ある種の音声認識 API を使用して音声を処理し、音声のトランスクリプトをテキストファイルに書き出すことでした。問題は、音声認識があまり正確ではなく、Microsoft の Speech API などの API が、文字化けした録音や雑音が多い録音でも音声を認識しようとする可能性があることです。Nuance の音声認識ソフトウェアのSDKバージョンがあることは知っていましたが、ウェブサイトで SDK の試用版を提供していないようで、まだ SDK を見る機会がありませんでした。

c#speech-recognition audio-fingerprinting

2013-08-14T21:09:01.470

0 投票する

1 に答える

364 参照

audio - MP3 の各分を個別の WAV にエクスポート

これは間違いなく奇妙な質問ですが、60 分の mp3 ミックスを 60 の個別の 1 分間の wav ファイルに分割して、Echonest などのオーディオフィンガープリンティング API で使用する方法を探しています。

これは単一のffmpegコマンドで可能ですか、それとも次の値でffmpegを複数回実行する必要がありますか?

-ss は秒単位の開始点です。-t は秒単位の期間です。

audio ffmpeg audio-fingerprinting

2013-08-29T11:29:42.370

0 投票する

1 に答える

380 参照

speech-recognition - 音声ファイルの類似度の測定方法

2 つの音声オーディオファイルがあります。それぞれが電話での会話から録音され、長さが異なります (最初のファイルは 3 秒ですが、2 番目のファイルは 5 秒です)。2 つのファイルの類似性を測定したいと考えています。音声信号のテキストコンテンツには関心がないことに注意してください (つまり、Speech to Text はありません)。類似性を測定して、スコアまたはパーセンテージを取得するだけです。

オーディオ指紋分析を行うツールはほとんど見つかりませんでしたが、ほとんどすべてが音楽オーディオファイルを対象としており、スピーチ時にうまく機能しないことがわかりました.

speech-recognition speech audio-fingerprinting

2013-11-16T06:14:54.663

0 投票する

3 に答える

1332 参照

c++ - オーディオ録音でさまざまなサウンド/ソースを検出する

UNI プロジェクトで考えたこのアイデアについて、アドバイスが必要です。

オーディオファイルを、異なるオーディオソースからの異なる「ストリーム」に分割できるかどうか疑問に思っていました。たとえば、オーディオファイルを次のように分割します: エンジンノイズ、電車のノイズ、声、常にそこにあるわけではないさまざまな音など。

必ずしもプログラミング言語からこれを行う必要はありませんが (理想的ですが)、Sound Forge などのサウンド処理ソフトウェアを使用して手動で行うこともできます。ただし、これが可能かどうかを最初に知る必要があります。音声処理については何も知りません。

最初の段階 (音の分離) が完了した後、処理された音の 1 つが別のオーディオ録音に存在するかどうかを判断したいと考えています。目的は音の検出です。（理想的な）例として、車のエンジン音を別のファイルと照合し、オーディオが車のエンジンの録音かどうかを判断します。それほど正確である必要はありません。クラクションのように、一定ではない音を検出していると思います。も大丈夫でしょう。

私はプログラミングの部分を行います。何を探すべきか（ソフトウェア、数学など）についてのいくつかの指針が必要です。私は専門家ではないので、可能であれば、これは本当に興味深いプロジェクトになるでしょう。

ありがとう。

c++audio audio-processing audio-fingerprinting

2014-03-31T14:12:15.800

問題タブ [audio-fingerprinting]

python - 音声指紋照合 - 最も近い一致を見つける

c# - 録音の品質を効率的にチェックする方法

audio - MP3 の各分を個別の WAV にエクスポート

speech-recognition - 音声ファイルの類似度の測定方法

c++ - オーディオ録音でさまざまなサウンド/ソースを検出する

Reference