フルレングスのトラックからオーディオサムネイルクリップ(長さ約30秒)を自動的に生成するシステムの開発を含む個人的なプロジェクトに取り組んでいます。
これを行うために、オーディオのエネルギーとピッチを調べて、その主要な構造的特徴を正しく特定しようと思います。
エネルギー/ピッチ抽出を実行できるオープンソースソフトウェアはありますか?そうでない場合は、MATLABを使用して別の方法を検討し始めます。
ありがとう!
フルレングスのトラックからオーディオサムネイルクリップ(長さ約30秒)を自動的に生成するシステムの開発を含む個人的なプロジェクトに取り組んでいます。
これを行うために、オーディオのエネルギーとピッチを調べて、その主要な構造的特徴を正しく特定しようと思います。
エネルギー/ピッチ抽出を実行できるオープンソースソフトウェアはありますか?そうでない場合は、MATLABを使用して別の方法を検討し始めます。
ありがとう!
YAAFE(Yet Another Audio Feature Extractor)http://yaafe.sourceforge.net/は、MATLAB、Python、およびCで音声特徴抽出を行います。
MARSYASには、分析用のbextractが含まれており、MFCCやその他のさまざまな音色およびスペクトルの特徴を見つけることができます。http://marsyas.info/
大胆さはそれをするかもしれません。
EchoNestAPIを調べることをお勧めします。オーディオ分析機能がたくさんあり、Remixパッケージにバンドルされているスクリプトがあり、曲を自動的に短いバージョンまたは長いバージョンに変換できます(スクリプトはイヤーワームと呼ばれていると思います)。
オーディオから特徴を抽出できるJAudioをお試しください。