現在、delphi を使用して .wav ファイルを読み込もうとしていますが、ここに私のコードがあります。
type
TWaveHeader = packed record
Marker_RIFF: array [0..3] of char;
ChunkSize: cardinal;
Marker_WAVE: array [0..3] of char;
Marker_fmt: array [0..3] of char;
SubChunkSize: cardinal;
FormatTag: word;
NumChannels: word;
SampleRate: longint;
BytesPerSecond: longint;
BytesPerSample: word;
BitsPerSample: word;
Marker_data: array [0..3] of char;
DataBytes: longint;
end;
TChannel = record
Data : array of double;
end;
いくつかの私的な宣言
private
wavehdr:TWaveHeader;
wavedata:array[0..3]of TChannel;
numsamples:integer;
関数
FillChar(wavehdr, sizeof(wavehdr), 0);
Stream.Read(wavehdr, sizeof(wavehdr));
{ Log Header data }
with memo1.Lines do begin
Add('Filename : '+od.FileName);
Add('Header size : '+inttostr(sizeof(wavehdr)));
tmpstr := wavehdr.Marker_RIFF;
Add('RIFF ID : '+tmpstr+'');
Add('Chunk size : '+inttostr(wavehdr.ChunkSize));
tmpstr := wavehdr.Marker_WAVE;
Add('WAVE ID : '+tmpstr+'');
tmpstr := wavehdr.Marker_fmt;
Add('''fmt '' ID : '+tmpstr+''' ');
Add('SubChunk size : '+inttostr(wavehdr.SubChunkSize));
Add('Format : '+inttostr(wavehdr.FormatTag));
Add('Num Channels : '+inttostr(wavehdr.NumChannels));
Add('Sample rate : '+inttostr(wavehdr.SampleRate));
Add('Bytes per second : '+inttostr(wavehdr.BytesPerSecond));
Add('Bits per sample : '+inttostr(wavehdr.BitsPerSample));
Add('Block Align : '+inttostr((wavehdr.NumChannels*wavehdr.BitsPerSample)div 8));
end;
numsamples := (file.size div (wavehdr.NumChannels*wavehdr.BitsPerSample)div 8) div wavehdr.BytesPerSample;
case wavehdr.NumChannels of
1:begin
SetLength(wavedata[0].Data, numsamples);
Stream.Read(wavedata[0].Data[0], numsamples);
end;
2:begin
SetLength(wavedata[0].Data, numsamples);
SetLength(wavedata[1].Data, numsamples);
for i := 0 to high(wavedata[0].Data) do begin
Stream.Read(wavedata[0].Data[i], 2);
Stream.Read(wavedata[1].Data[i], 2);
end;
end;
end;
上記のコードは、.wav ヘッダーに関するまったく同じ情報と詳細 (MATLAB DOES と同じ) を提供します。
- ファイル名:E:\dephi\classic3.wav
- リフID : リフ
- チャンクサイズ:18312354
- ウェーブID : ウェーブ
- 'fmt' ID: fmt'
- サブチャンクサイズ:16
- フォーマット:1(PCM)
- チャンネル数 : 2 (ステレオ)
- サンプルレート : 44100
- 1 秒あたりのバイト数: 176400
- サンプルあたりのビット数: 16
- ブロック整列 : 4
(wavedata のサイズ/wavedata の blockalign)-44 で計算される合計サンプル データを除いて、44 は wav のヘッダーです。正確ではなく、 5,1,10 でミスすることもあります。私は5つのサンプルを使用してテストしただけです.そしてここに例があります:
- classic1.wav matlab:3420288, delphi(私の計算):(13681352/4)-44= 3420294
- classic2.wav matlab:2912256, delphi(私の計算):(11649204/4)-44= 2912257
また、matlab と delphi のサンプル データの値も異なります。
classic1.wav MATLAB:(最初の 10 個の値の左チャンネルと右チャンネル)
- -3.05175781250000e-05 [] 6.10351562500000e-05
- -6.10351562500000e-05 [] 6.10351562500000e-05
- -6.10351562500000e-05 [] 3.05175781250000e-05
- 0 [] -3.05175781250000e-05
- 6.10351562500000e-05 [] -6.10351562500000e-05
- 6.10351562500000e-05 [] -6.10351562500000e-05
- 3.05175781250000e-05 [] -3.05175781250000e-05
- 6.10351562500000e-05 [] -6.10351562500000e-05
- 3.05175781250000e-05 [] 0
- -3.05175781250000e-05 [] 6.10351562500000e-05
DELPHI:(最初の 10 個の値 leftchannel と rightchannel)
- 9.90156960830442E-320 [] 1.00265682167023E-319
- 9.90156960830442E-320 [] 9.77113627780233E-320
- 3.26083326255223E-322 [] 0
- 1.39677298735779E-319 [] 1.37088394751571E-319
- 1.45932169812129E-319 [] 1.33373021094845E-319
- 1.23175506164681E-319 [] 1.206903559661E-319
- 1.28239679034554E-319 [] 1.40932225476216E-319
- 1.37068632125737E-319 [] 1.33382902407761E-319
- 1.33373021094845E-319 [] 1.25685359645555E-319
- 1.40907522193924E-319 [] 1.33358199125469E-319
私の質問は:
- wav ファイルの全サンプルを検索する場合、どのように正しく行うのですか?
- matlab と delphi が wav ファイル (データ チャンク) を読み取る方法は異なりますか? それとも私のコードはここにあるものでしたか?
- MATLAB と同じ値を取得する方法はありますか?
編集:私はmBoアドバイスに従い、mboアドバイスに変更しました
Data : array of SmallInt;
numsamples := wavehdr.DataBytes div (wavehdr.NumChannels * wavehdr.BitsPerSample div 8);
Stream.Read(wavedata[0].Data[i], SizeOf(SmallInt));
解釈部分はよくわかりませんが、に変更しました
floattostr(wavedata[0].Data[i]/32768.0)
floattostr(wavedata[1].Data[i]/32768.0)
私が得る結果:
- 0.611602783203125 [] 0.61932373046875
- 0.611602783203125 [] 0.603546142578125
- 0.0023193359375 [] 0
- 0.862762451171875 [] 0.846771240234375
- 0.901397705078125 [] 0.823822021484375
- 0.760833740234375 [] 0.7454833984375
- 0.7921142578125 [] 0.870513916015625
- 0.799774169921875 [] 0.761016845703125
- 0.8238525390625 [] 0.782623291015625
- 0.354766845703125 [] 0.76123046875