音声ファイルのどの部分に音声または音楽が含まれているかを特定したいと考えています。
誰かがこのようなものを作っているか、どこから始めればよいか教えてくれることを願っています. 同じことを行うための方法/チュートリアルを提案してください。
ありがとうございました。
音声ファイルのどの部分に音声または音楽が含まれているかを特定したいと考えています。
誰かがこのようなものを作っているか、どこから始めればよいか教えてくれることを願っています. 同じことを行うための方法/チュートリアルを提案してください。
ありがとうございました。
pyAudioAnalysis python ライブラリを確認してください。とりわけ、事前トレーニング済みの音声音楽分類器と 2 つのセグメンテーション分類メソッド (1 つは固定サイズのウィンドウに基づく方法、もう 1 つは HMM に基づく方法) を備えています。
音声録音の音声部分と音楽部分を非常に簡単に抽出できます。たとえば、次のようになります。
from pyAudioAnalysis import audioSegmentation as aS
[flagsInd, classesAll, acc] = aS.mtFileClassification("data/scottish.wav", "data/svmSM", "svm", True, 'data/scottish.segments')
結果はこの画像のようになります
この分野には多くの先行技術がありますが、Dan Ellis の論文を参照することをお勧めします。この講演のスライドには、いくつかの優れた背景があります。要するに、適切な特徴ベクトルを選択することがすべてです。