3

ケプストラル法で周波数を見つけようとしています。私のテストでは、次のファイルhttp://www.mediacollege.com/audio/tone/files/440Hz_44100Hz_16bit_05sec.wav、周波数 440Hz のオーディオ信号を取得しました。

次の式を適用しました。

ケプストラム = IFFT (log FFT (s))

256 チャンクを取得していますが、結果は常に間違っています...

from numpy.fft import fft, ifft
import math
import wave
import numpy as np
from scipy.signal import hamming  

index1=15000;
frameSize=256;
spf = wave.open('440.wav','r');
fs = spf.getframerate();
signal = spf.readframes(-1);
signal = np.fromstring(signal, 'Int16');
index2=index1+frameSize-1;
frames=signal[index1:int(index2)+1]

zeroPaddedFrameSize=16*frameSize;

frames2=frames*hamming(len(frames));   
frameSize=len(frames);

if (zeroPaddedFrameSize>frameSize):
    zrs= np.zeros(zeroPaddedFrameSize-frameSize);
    frames2=np.concatenate((frames2, zrs), axis=0)

fftResult=np.log(abs(fft(frames2)));
ceps=ifft(fftResult);

posmax = ceps.argmax();

result = fs/zeroPaddedFrameSize*(posmax-1)

print result

この場合、結果 = 440 を取得するにはどうすればよいでしょうか?

**

アップデート:

**

ソースを matlab で書き直したところ、すべてが機能するようになりました。440 Hz と 250 Hz の周波数でテストを行いました ...

440Hzの場合、441Hzは悪くありません

250Hzの場合、結果に近い249.1525Hzが得られます

ピークをケプストラム値にする簡単な方法を 1 つ作成しました。

Quadract 補間を使用して最大値を見つけると、より良い結果が得られると思います。

440Hzの推定結果をプロットしています

ここに画像の説明を入力

ケプストラム周波数推定のソースを共有する:

%% ederwander Cepstral Frequency (Matlab)
waveFile='440.wav';
[y, fs, nbits]=wavread(waveFile);

subplot(4,2,1); plot(y); legend('Original signal');

startIndex=15000;
frameSize=4096;
endIndex=startIndex+frameSize-1;
frame = y(startIndex:endIndex);

subplot(4,2,2); plot(frame); legend('4096 CHUNK signal');

%make hamming window
win = hamming(length(frame));


%samples multplied by hamming window
windowedSignal = frame.*win;


fftResult=log(abs(fft(windowedSignal)));
subplot(4,2,3); plot(fftResult); legend('FFT signal');

ceps=ifft(fftResult);

subplot(4,2,4); plot(ceps); legend('ceps signal');

nceps=length(ceps)

%find the peaks in ceps

peaks = zeros(nceps,1);

k=3;

while(k <= nceps - 1)
   y1 = ceps(k - 1);
   y2 = ceps(k);
   y3 = ceps(k + 1);
   if (y2 > y1 && y2 >= y3)
      peaks(k)=ceps(k);
   end
k=k+1;
end

subplot(4,2,5); plot(peaks); legend('PEAKS');

%get the maximum ...
[maxivalue, maxi]=max(peaks)



result = fs/(maxi+1)


subplot(4,2,6); plot(result); %legend('Frequency is' result);

legend(sprintf('Final Result Frequency =====>>> (%8.3f)',result)) 
4

3 に答える 3

4

サンプルレートが44.1kHzの場合、256はおそらく小さすぎて有用なことは何もできません。この場合のFFTの解像度は、44100/256 =172Hzになります。たとえば10Hzのオーダーの解像度が必要な場合は、4096のFFTサイズを使用できます。

于 2012-02-06T15:14:06.683 に答える
2

同様の問題があったため、コードの一部を再利用し、同じフレームの連続評価を実行してから中間値を選択することにより、結果の品質を改善しました

安定した結果を得ています。

def fondamentals(frames0, samplerate):
    mid = 16
    sample = mid*2+1
    res = []
    for first in xrange(sample):
        last = first-sample
        frames = frames0[first:last]
        res.append(_fondamentals(frames, samplerate))
    res = sorted(res)
    return res[mid] # We use the medium value

def _fondamentals(frames, samplerate):    
    frames2=frames*hamming(len(frames));
    frameSize=len(frames);
    ceps=ifft(np.log(np.abs(fft(frames2))))
    nceps=ceps.shape[-1]*2/3
    peaks = []
    k=3
    while(k < nceps - 1):
        y1 = (ceps[k - 1])
        y2 = (ceps[k])
        y3 = (ceps[k + 1])
        if (y2 > y1 and y2 >= y3): peaks.append([float(samplerate)/(k+2),abs(y2), k, nceps])
        k=k+1
    maxi=max(peaks, key=lambda x: x[1])
    return maxi[0]
于 2013-07-30T14:38:48.950 に答える
2

ケプストラム法は、純粋な正弦波に近い信号ではうまく機能しませんが、高い高調波成分を持つ信号で最適に機能します。

最良のテスト信号は、時間領域での反復的でほぼ等間隔のインパルスのようなものである可能性があり (FFT ウィンドウごとに多いほど良い)、周波数領域で反復的で等間隔のピークに近いものを生成する必要があります。ケプストラムの励起部分として。インパルス応答は、ケプストラムの下部フォルマント部分で表されます。

于 2012-02-06T19:00:00.237 に答える