3

私はオーディオの世界に不慣れで、対処方法がわからないタスクを割り当てられました。WAV ファイルのピッチを表すグラフを表示する必要があります。WAV ファイルはポリフォニックにすることができます。その場合、支配的な (つまり、最も音量の大きい) 楽器 (または人間の声の歌唱) のピッチ グラフを表示する必要があります。私は .NET に精通しており、C、C++、Java についてはほとんど知りません。

私はウェブで調査を開始し、ポリフォニック WAV ファイルのピッチ検出は解決されていない問題であることを理解しましたが、正確なピッチは必要ありません。次のものよりも高いかどうか、そしてそのピッチは何であるかを知るためだけです長さ。

私の質問は次のとおりです。

  1. このタスクの背後にある理論を学ぶには、どこから始めればよいですか? そのためにおすすめの本はありますか?

  2. それを行うことができるAPI/ツールはありますか?

ありがとう、

ML

4

3 に答える 3

2

フーリエ解析を使用して、波の構成周波数を抽出できます。関連する SO の質問は次のとおりです。C# での高速フーリエ変換

于 2009-07-31T14:10:40.927 に答える
1

私はデジタル信号処理で信号処理を始めました。印刷された本を約 30 ドルで購入するか、pdf を無料でダウンロードできます。これは非科学者向けに書かれており、さまざまな信号処理技術を使い始めるための大量の情報が含まれています。

FFT (高速フーリエ変換) は、時間対振幅信号を周波数 (ビン) 対強度 (エネルギー) に変換します。多くの Web サイトで見られる標準的なグラフを使用して、頻度から音符に移動できます。

于 2009-07-31T14:32:58.440 に答える
0

私はやや関連するプロジェクトに取り組んできました。高速フーリエ変換を調査する必要があります。C# で書かれたこのプロジェクトをお勧めします。これはギター チューナーとして書かれていますが、目的に合わせて簡単に変更できます。

ただし、これはマルチピッチにはなりません。「Direct Note Access (DNA)」を利用してこの能力を持っていると主張する「セレモニー」という製品があります。彼らの技術は当然のことながらクローズド ソースですが、適切な価格でライセンスを取得できる可能性があります。

于 2009-07-31T14:23:02.560 に答える