問題タブ [audio-fingerprinting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - Windows 10 (UAP) で AudioGraph を使用して Chromaprint フィンガープリントを生成するための PCM データの抽出
私は現在、クロマプリントを使用して曲を識別し、acoustid.org からデータを取得する Win 10 アプリを作成しようとしています。
しかし、私の ExtractPCM-Methods は間違った値を返します。多くの値に返される最初の問題。237 秒に対して 246 秒という多くのデータが必要です。2 番目の値は fpcalc.exe によって返されます。
2 つ目の問題は、私の ExtractPCM の実装が、オープンソース プロジェクトで見つけた実際の実装とは完全に異なる値を返すことです。私はオーディオをよく理解していませんが、私の価値観は明らかに間違っていると思います。
コードをテストするために使用する参照実装はAresRpgです。BASS を使用して PCM データを抽出します。
Data BASS の戻り値は 10.054 のゼロから始まり、次のように続きます。
-1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 -1 0 0 0 -1 0 0 0 0 0 0 0 0 0 -1 - 1 0
2 秒マークの最後の最後の値は次のようになります。
612 627 635 647 655 656 662 662 663 658
私の実装は 10.528 ゼロで始まり、その後に次のものが続きます。
-15194 11946 21344 12111 25732 12414 -28715 12748 6098 12973 -31198 13046 28784 12844 21248 12797 1592 13165 22544 13294 -20448
そして、で終わる
13636 -17580 -18770 -17639 -29613 -17604 10168 -17608 20472 -17618
私のExtractPCMは次のようになります
AresRPG は次のコードを使用してデータを読み取ります。
編集
安全でないブロックを次のように変更しました。
これは、SubType が float でない場合でも、データの格納に使用された形式が浮動小数点だったためです。
今、私は曲として認識できるデータを取得します (私は人として) が、それでも何かがおかしい :(
私の抽出は少し長く、より大きくなっています。したがって、両方のバージョンを同時に再生すると、開始は同期しているように見えますが、すぐに両方のトラックが異なる速度で再生されることがわかります。最終的には約1秒の差です。音量が指紋に影響を与える可能性はないと思いますが、デコード速度が遅いほど違いが生じる可能性があります.
私がテストに使用したサンプルは、acousid.org によって識別される Adele の Rolling Deep でした。しかし、編集したバージョンを投稿することは許可されていないと思います。
そこで、このcc Songを使用して、左側のチャネルに私のデコードを、右側のチャネルに Ares のデコードを含むwav ファイルを作成しました。
残念ながら、この曲は acusticId データベースにありません。少なくとも指紋は見つかりません。
python - Python - audiodiff は存在するファイルを見つけることができません
wav ファイルを比較しています。LMDE Betsy に切り替えるまで、このスクリプトは正常に機能していました。私のエラーを引き起こしている関数は次のとおりです。
私が最初に考えたのは、同じファイルを 2 回開こうとしているということでしたが、それw.src_path != arg_wav.src_path
を説明する必要があります。私はこの出力を得ています:
私の機能から:
トレースバック:
奇妙なのは、昨日、Linux Mint 17.1とWindows 7 で動作したことです。これは、私が知らない奇妙な Debian の規則ですか? はい、再確認しましたが、両方のファイルが記載されているパスに存在します。
android - オーディオ入力用の Musicg フィンガープリント
musicg では、次のコードで Wave ファイルのフィンガープリントを比較できます。
音声を保存して比較する代わりに、MIC 入力を直接入力して指紋の類似性を取得できますか?
例:
編集: Wave.java では、関数 initWaveWithInputStream() でフィード MIC 入力を Inputstream として送信できますか? 出来ますか ?
windows - echoprint 指紋生成 Windows vs Linux
Windows 7-64ビットおよびUbuntuでオーディオファイルの指紋を生成していましたが、指紋コードは同じではありません(コードフィールドを意味します)。コンパイル済みの Windows ソースを使用しました。それは同じではないはずですか、それとも何か間違ったことをしましたか。
アップデート
Windows
C:\ecoprint\codegen.exe Kalimba.mp3 > code.txt
Ubuntu
/home/regata/echoprint-codegen$ ./echoprint-codegen Kalimba.mp3 > code.txt
samples_decodedおよびcode_countフィールドは異なり、もちろんコード部分も異なります。
audio-fingerprinting - curlを使用してechoprintローカルサーバーにクエリを実行するには?
私はechonestとcurlに非常に慣れていません。稼働中の echoprint サーバーがあり、echoprint codegen も正常に動作しています。インジェスト メソッドを使用してローカル サーバーにコードをプッシュできます。
しかし、curl リクエストを使用してサーバーにクエリを実行する方法がわかりません。
echoprint サーバーを照会するための curl 要求の構文または例を送信するにはどうすればよいですか?
ios - ACRCloud Music Recognition SDK のオフライン DB ファイルを読み取れない
助けてください、
Shazam のような映画館でのオフライン認識には、ACRCloud の Music Recognition iOS SDK を使用しています。オーディオ ファイルをアップロードし、オフライン DB ファイルをダウンロードした後、次のエラーが発生しました。
どうすればこの問題を解決できますか、私は初心者です
ads - ラジオ広告を監視するための音声フィンガープリンティング サービスはありますか?
私たちは、クライアントが出力(広告)と競合他社を監視するのに役立つ無線監視製品を持っています.
既存のシステム/ツールは、関係するラジオと人間の EPG 情報に基づいているため、信頼性に問題があります。
したがって、主に既存の製品に堅牢性を追加するためにこれを検討しています。
私は、オーディオフィンガープリンティング技術がこの問題を解決できることを知っています。自己コンテンツのアップロードと認識(監視)をサポートするサービスはありますか?
任意の推奨事項をいただければ幸いです。