私は音声処理が初めてです。ですから、私の無知をお許しください。短い音声信号 (10 秒) が与えられ、MATLAB または Wavesufer ソフトウェアを使用して手動でピッチに注釈を付けるように求められました。音声信号のピッチを見つけるにはどうすればよいでしょうか。問題を解決するための理論的なリソースはありますか? Wavesurfer を使って信号のピッチコンターをプロットしてみました。
編集 1: 私の仕事では、データにさまざまなピッチ検出アルゴリズムを適用し、それらの精度を比較しています。したがって、手動で注釈を付けたピッチが参照として機能します。
更新 1: EGG (dEGG) 信号を微分して GCI (Glottal Closure Instants) を取得しました。dEGG のピークは GCI です。2 つの連続する GCI 間の時間間隔は、ピッチ周期 (秒) です。ピッチ周期の逆数はピッチ (hz) です。
更新 2 : SIGMA は、自動 GCI 検出の有名なアルゴリズムです。
みんな、ありがとう。