公開データセットで自分の音楽ジャンル アルゴリズムをテストして、他の既存のアルゴリズムと比較したいと考えています。MIREX の場合、すべてのデータが利用できるわけではありません。GTZAN データセットがリンク (marsyas.info/download/data_sets) で利用できることがわかりましたが、現在は利用できません。
このデータを取得する方法を知っていますか? MFCC 以外の機能を使用しているため、音楽だけでなくジャンルの注釈も必要です。
前もって感謝します。
公開データセットで自分の音楽ジャンル アルゴリズムをテストして、他の既存のアルゴリズムと比較したいと考えています。MIREX の場合、すべてのデータが利用できるわけではありません。GTZAN データセットがリンク (marsyas.info/download/data_sets) で利用できることがわかりましたが、現在は利用できません。
このデータを取得する方法を知っていますか? MFCC 以外の機能を使用しているため、音楽だけでなくジャンルの注釈も必要です。
前もって感謝します。
編集: 現在、Marsyas ページは marsyasweb.appspot.com でホストされているようで、データ セットのサブページに GTZAN データベースへのリンクがあります。
また、大学のプロジェクト用に GTZAN データセットを探していたhttp://marsyas.info
ところ、それがダウンしていることがわかったので、marsyas.info/download/data_sets に Google Web キャッシュを使用しました(詳細については、こちらを参照してください)。幸いなことに、GTZAN データ セットは でホストされてhttp://opihi.cs.uvic.ca
おり、ダウンロードできます。
ただし、データセットを使用する前にライセンスに注意してください (キャッシュされた marsyas ダウンロード ページからの情報)。
このデータセットは、オーディオおよび音声処理に関する IEEE トランザクション 2002 の G. Tzanetakis と P. Cook によるジャンル分類のよく知られた論文「オーディオ信号の音楽ジャンル分類」に使用されました。
残念ながら、データベースは私の研究の非常に初期の段階で徐々に収集されたため、タイトルはありません (もちろん、著作権の許可などもありません)。ファイルは、さまざまな録音条件を表すために、2000 年から 2001 年にかけて、個人の CD、ラジオ、マイク録音などのさまざまなソースから収集されました。とはいえ、主に比較などの目的で研究者の要望に応じて提供しています。このデータセットを使用した実験結果を公開する場合は、George Tzanetakis (gtzan@cs.uvic.ca) までご連絡ください。
データセットは、30 秒ごとに 1000 のオーディオ トラックで構成されます。10 のジャンルが含まれており、それぞれが 100 のトラックで表されます。トラックはすべて、.wav 形式の 22050Hz モノラル 16 ビット オーディオ ファイルです。
Magnatagatune - などの他のデータセットにも興味があるかもしれませんhttp://tagatune.org/Magnatagatune.html
。
私もそのようなベンチマークを探しています。
これは、「特徴抽出と機械学習による音から「感覚」へ-音楽を特徴付ける高レベルの記述子の導出」という論文で見つけました。
音楽情報検索コミュニティでは、著作権の問題なしに関心のあるすべての研究者が利用できるラベル付き音楽の大規模なリポジトリを編集するために、現在いくつかの取り組みが行われています。この注目すべき例は、後藤正孝のRWC音楽データベース(http://staff.aist.go.jp/m.goto/RWC-MDB)、大学のIMIRSEL(国際音楽情報検索システム評価研究所)プロジェクトです。アーバナシャンペーンのイリノイ大学(http://www.music-ir.org/evaluation — [12]も参照)と新しいFreeSoundイニシアチブ(http://freesound.iua.upf.edu)。
しかし、私はそれらから有用なものを見つけることができませんでした。最初に言及したデータベースのコピーを取得する手順をここで説明しますが、かなり洗練されているようです。
Echonest と Labrosa によってリリースされた、オーディオ機能、タグ、歌詞などを含む 100 万曲を含むMillion Songs Datasetが必要なようです。もちろん、これは音楽のメタデータとトランスクリプションから作業していることを前提としています。
生のオーディオを探している場合...それは別の問題です。あなたが出版を希望するかどうかはわかりませんが、その場合、知的財産法がより重要な要素になる可能性があります。しかし、個人的なテストでは、自分の音楽ライブラリのファイルをそのまま使用できるのではないかと思います (たとえば、iTunes のダウンロードには、アルゴリズムをテストするためのジャンル タグが既にあります)。
免責事項: 私は弁護士ではありません。私の法的アドバイスは、ご自身の責任でお受けください。