0 投票する

0 に答える

143 参照

audio - オーディオフィンガープリンティング: Echoprint や AcusticID などのツールを使用して正確なオーディオタイムコードを見つけることはできますか?

ランドマークベースのフィンガープリンティングが時間と周波数を使用することは理解していますが、オープンソースツールを使用してランドマークのタイムコード / オフセットを出力として取得できますか? または、一部のコンテンツをオーディオと同期するための何か他のものはありますか?

2015-12-10T13:52:32.160

0 投票する

0 に答える

481 参照

solr - echoprint サーバー - 指紋検索に 2 ～ 3 秒かかる

指紋一致の solr クエリ時間の増加に直面しています。以下は私たちのセットアップ情報です:

単一ノード (solr 1.0) で実行されている echonest/echoprint-server amazon ec2 インスタンスで実行されている m3.2x ラージボックス (30G RAM & 8 コア)
約 91G の solr 1.0 インデックスサイズで取り込まれた 250 万トラック (セグメント数 19933333)。
適用された最適化 HashQueryComponent.java https://github.com/playax/echoprint-server/commit/706d26362bbe9141203b2b6e7846684e7a417616#diff-f9e19e870c128c0d64915f304cf43677
また、eval メソッドの統計を取得しようとしましたが、インデックスリーダーの順次サブリーダーのループ反復の一部で、すべての用語を反復するのに 1 秒以上かかりました。

正しい方向への提案や指針は非常に役に立ちます。

solr audio-fingerprinting echonest echoprint

2016-01-04T12:40:20.507

0 投票する

1 に答える

2219 参照

machine-learning - MFCC係数ベクトルを使用して機械学習アルゴリズムをトレーニングする方法は?

私の最終年度のプロジェクトでは、犬/樹皮/鳥の音をリアルタイムで識別しようとしています (サウンドクリップを録音することによって)。オーディオ機能として MFCC を使用しています。最初に、jAudio ライブラリを使用してサウンドクリップから 12 個の MFCC ベクトルを抽出しました。今、私は機械学習アルゴリズムを訓練しようとしています (現時点ではアルゴリズムを決定していませんが、おそらく SVM です)。サウンドクリップのサイズは約 3 秒です。このプロセスに関するいくつかの情報を明確にする必要があります。彼らです、

フレームベースの MFCC (フレームごとに 12) または全体的なクリップベースの MFCC (サウンドクリップごとに 12) を使用して、このアルゴリズムをトレーニングする必要がありますか?
アルゴリズムをトレーニングするには、12 の MFCC すべてを 12 の異なる属性と見なす必要がありますか、それとも 12 の MFCC を 1 つの属性と見なす必要がありますか?

これらの MFCC は、クリップの全体的な MFCCS です。

-9.598802712290967 -21.644963856237265 -7.405551798816725 -11.638107212413201 -19.441831623156144 -2.780967392843105 -0.5792847321137902 -13.14237288849559 -4.920408873192934 -2.7111507999281925 -7.336670942457227 2.4687330348335212

これらの問題を克服するために、どんな助けも本当に感謝しています。Google で適切なヘルプを見つけることができませんでした。:)

machine-learning signal-processing audio-processing mfcc audio-fingerprinting

2016-02-07T12:05:57.167

0 投票する

1 に答える

960 参照

android - Android で指紋 API の KeyGenerator を使用してキーを生成する方法

アプリケーションに FingerPrint API を実装しようとしています。この目的のために、Google の指紋ダイアログのサンプルに従っています。

正常に動作compileSdkVersion=23しminSdkVersion=23 ますが、私のアプリケーションcompileSdkVersionは 21 でminSdkVersion14 です。この目的のために、正常に動作するFingerprintManagerCompat代わりに使用しFingerprintManagerていますが、問題はキー生成にあります。

キーストアパッケージとそのクラスは、キーを生成するために利用できません。キー生成用にサポートされているすべてのアルゴリズムは、18 以降の API バージョンで利用できます。下位バージョンをサポートするためのキーを生成する方法を教えてください。

android android-6.0-marshmallow audio-fingerprinting key-generator

2016-02-11T14:43:01.113

0 投票する

1 に答える

508 参照

ios - Gracenote SDK (GNSDK) を使用してファイルを読み取り、指紋認識を実行する

iOS から 16 ビット 16KHz wav (長さ 20 秒) を読み取って、指紋識別を実行しようとしています。ガイド「GNSDK-for-Mobile-iOS-Developers-Guide」に従ってみましたが、53 ページに目的の c の例がありません (C# のみ)。私のコードは、ファイル全体を読み取り、2K ブロックを関数 FingerprintWrite に書き込みます (ファイル全体へのポインターを渡すことも試みました)。変数 "result" が 1 に設定されることはありません - 不十分なデータが渡されたことを示します - しかし、20 秒あれば十分ですよね? 誰か助けてくれませんか? ありがとう。

これは私がやったことです：

ios gracenote audio-fingerprinting

2016-02-16T15:20:00.660

0 投票する

2 に答える

663 参照

python - 3,000 万行を超える acoustid データベースをより効率的に検索するにはどうすればよいですか?

現在、acoustid というオープンソースの音楽認識プロジェクトをいじっています。3,000 万行 (300 GB のデータ) を超えるテーブルをインポートしましたが、これらの行を単純に選択するのに非常に時間がかかります。現在、200,000 行の選択には 30 秒かかる場合があります。

このプロジェクトは、フィンガープリントの最初の 15 秒間だけを検索し、これを hdd に保存することで、行にインデックスを付ける acoustid-index を提供しています。これは、RAM にロードされます。https://bitbucket.org/acoustid/acoustid-index/overview

ただ、これの使い方がわかりません。説明がわかりにくいです。これはPostgreSQL用に作成されたようです。作業中のサーバーで MySQL と Python を使用しています。これを使用してデータベースのインデックスを作成できますか?

これを使用してデータベース内の行にインデックスを付ける方法について何か提案はありますか? このデータベースでの検索をより効率的にする他の方法はありますか?

python mysql postgresql relational-database audio-fingerprinting

2016-03-15T21:36:35.457

0 投票する

1 に答える

1496 参照

python - URL からの音楽の録音と認識

ディスクとマイクから音楽を認識できるpython DeJavuで、オープンソースのオーディオフィンガープリンティングプラットフォームを使用しています。ディスクからの認識をテストしましたが、素晴らしいです。100% の精度。

クラス「BroadcastRecognizer」を追加する方法について支援を求めますこれは、オンラインラジオの URL のオンラインストリームの例から音楽を認識します [ http://bbcmedia.ic.llnwd.net/stream/bbcmedia_radio1_mf_p] ラジオストリームの音楽は常に10秒ごとに認識するように設定したいと思います。

これが認識.pyです

これがdejavu.pyです

python json numpy audio audio-fingerprinting

2016-05-28T08:58:56.853

0 投票する

1 に答える

324 参照

android - Live Lyrics はコンテンツ認識でどのように機能しますか

多くの曲識別プラットフォームは、認識された曲のライブ同期歌詞を表示する機能を提供しています。これには、歌詞を表示し、リアルタイムで曲で現在再生されている歌詞の部分を強調表示することが含まれます。

また、強調表示する行を示すタイムスタンプを含む、対応する歌詞ファイルの使用が含まれる場合もあります。LRC ファイルの例

これを実装するために、認識結果のメタデータをどのように使用できますか。認識結果の例はこちら

android json python-2.7 audio-fingerprinting

2016-06-09T20:57:20.153

0 投票する

2 に答える

2247 参照

audio-fingerprinting - ブロードキャスト mp3 のオープンソースオーディオフィンガープリンティング

いくつかの Web ラジオフィードの曲を認識するアプリを作成しています。フィードを解析して曲を見つける必要があります。それができる有料サービス (ACRCloud) を見つけましたが、数を考えるとコストが高くなります。を分析したいので、少し検索したところ、Echoprint が見つかりました。適切でしょうか？ドキュメントが見つからないのはなぜですか...わかりません。もっと良い解決策があるのでしょうか? ありがとうございました

audio-fingerprinting echoprint

2016-07-25T11:24:39.587

問題タブ [audio-fingerprinting]

これが認識.pyです

これがdejavu.pyです

Reference