私はポリフォニック音楽のトランスクリプションプロジェクトに取り組んでいます。私はいくつかの論文を読み、同様のタスクを説明する記事を読みました。私は問題領域の多くの側面について非常に混乱しています。誰かが私を助けてくれることを願っています。
これまでのところ、特定のmp3からデコードされたオーディオデータのストリームを取得しました。
私は、発症の検出が転写への第一歩であることを理解しました。。発症の検出に使用できるJavaライブラリはありますか。
次に、私が読んだように、基本周波数の検出もFFTを使用して行われます。
これらのタスクでのFFTの使用法を知りたいです。(私はFFTにあまり精通していません)。発症検出とF0検出のためにFFTを実行することは絶対に必要ですか?そうでない場合、他の方法は何ですか。私が持っているオーディオストリームでFFTを実行できますか、またはこれらのオーディオデータを操作するために実行する必要がある他の操作がありますか?
どうもありがとう。