私はオーディオの世界に不慣れで、対処方法がわからないタスクを割り当てられました。WAV ファイルのピッチを表すグラフを表示する必要があります。WAV ファイルはポリフォニックにすることができます。その場合、支配的な (つまり、最も音量の大きい) 楽器 (または人間の声の歌唱) のピッチ グラフを表示する必要があります。私は .NET に精通しており、C、C++、Java についてはほとんど知りません。
私はウェブで調査を開始し、ポリフォニック WAV ファイルのピッチ検出は解決されていない問題であることを理解しましたが、正確なピッチは必要ありません。次のものよりも高いかどうか、そしてそのピッチは何であるかを知るためだけです長さ。
私の質問は次のとおりです。
このタスクの背後にある理論を学ぶには、どこから始めればよいですか? そのためにおすすめの本はありますか?
それを行うことができるAPI/ツールはありますか?
ありがとう、
ML