libsndfile を使い始めるのに助けが必要です。
4 つの .wav ファイルがあります (すべて同じサンプル レート)。
最初の 2 つを結合し、次の 2 つを結合したいのですが、
次に、結果の 2 つの .wav ファイルを 1 つにミックスします。
libsndfile を使い始めるのに助けが必要です。
4 つの .wav ファイルがあります (すべて同じサンプル レート)。
最初の 2 つを結合し、次の 2 つを結合したいのですが、
次に、結果の 2 つの .wav ファイルを 1 つにミックスします。
2 つの wav ファイルのミキシング用。
#include <cstdio>
#include <sndfile.h>
#include <windows.h>
#include <cstdlib>
#include <cmath>
#define BUFFER_LEN 1024
#define MAX_CHANNELS 6
static void data_processing (double *data, int count, int channels) ;
int main (void) {
static double data [BUFFER_LEN] ;
static double data2 [BUFFER_LEN] ;
static double outdata [BUFFER_LEN] ;
SNDFILE *infile, *outfile, *infile2 ;
SF_INFO sfinfo ;
int readcount ;
SF_INFO sfinfo2 ;
int readcount2 ;
const char *infilename = "inputOne.wav" ;
const char *infilename2 = "inputTwo.wav" ;
const char *outfilename = "output.wav" ;
if (! (infile = sf_open (infilename, SFM_READ, &sfinfo))) {
/* Open failed so print an error message. */
printf ("Not able to open input file %s.\n", infilename) ;
/* Print the error message from libsndfile. */
puts (sf_strerror (NULL)) ;
return 1 ;
} ;
if (sfinfo.channels > MAX_CHANNELS) {
printf ("Not able to process more than %d channels\n", MAX_CHANNELS) ;
return 1 ;
} ;
if (! (infile2 = sf_open (infilename2, SFM_READ, &sfinfo2))) {
/* Open failed so print an error message. */
printf ("Not able to open input file %s.\n", infilename2) ;
/* Print the error message from libsndfile. */
puts (sf_strerror (NULL)) ;
return 1 ;
} ;
if (sfinfo2.channels > MAX_CHANNELS) {
printf ("Not able to process more than %d channels\n", MAX_CHANNELS) ;
return 1 ;
} ;
/* Open the output file. */
if (! (outfile = sf_open (outfilename, SFM_WRITE, &sfinfo))) {
printf ("Not able to open output file %s.\n", outfilename) ;
puts (sf_strerror (NULL)) ;
return 1 ;
} ;
while ((readcount = sf_read_double (infile, data, BUFFER_LEN)) &&
(readcount2 = sf_read_double (infile2, data2, BUFFER_LEN))) {
data_processing (data, readcount, sfinfo.channels) ;
data_processing(data2, readcount2, sfinfo2.channels) ;
for(int i=0; i < 1024;++i) {
outdata[i] = (data[i] + data2[i]) -(data[i])*(data2[i])/65535;
}
sf_write_double (outfile, outdata , readcount) ;
} ;
/* Close input and output files. */
sf_close (infile) ;
sf_close (infile2) ;
sf_close (outfile) ;
system("PAUSE");
return 0 ;
} /* main */
static void data_processing(double *data, int count, int channels) {
double channel_gain [MAX_CHANNELS] = { 0.5, 0.8, 0.1, 0.4, 0.4, 0.9 } ;
int k, chan ;
for (chan = 0 ; chan < channels ; chan ++)
for (k = chan ; k < count ; k+= channels)
data [k] *= channel_gain [chan] ;
return ;
} /* data_processing */
これは、16 ビット信号である 2 つの単純な wav ファイルを混合する方法です。
まず第一に、オーディオのミキシングは、思っているほど簡単ではありません。2 つの信号を結合した後、多くのあいまいさが生じる可能性があります。私の場合、必要なだけうまく機能していますが、正確な結果が必要な場合は、信号を互いに正確に重ね合わせるためにさらにグーグルする必要があるかもしれません.
2 つの wav ファイルを結合するには、最初の wav ファイルを読み込んで結果の wav ファイルにデータをコピーし、最後に 2 番目の wav ファイルのデータを結果の wav ファイルに追加します。
このリンクも役に立つかもしれません http://www.vttoth.com/digimix.htm
これは古いですが、私はそれを読んでいるので、他の誰かが必然的にそうするでしょう.
libsndfile の使用に関しては nishantmishra に概ね同意しますが、このミキシング アルゴリズムは、著者の期待どおりに動作していた場合、ある程度の歪みを引き起こす可能性があります。
outdata[i] = (data[i] + data2[i]) -(data[i])*(data2[i])/65535;
(実際には、その最後の項は低レベルのノイズを少し追加するだけです... V-Tothの記事を読む前に、これは興味深い形のディザだと思いました)、これが意図したとおりに機能する方法で適用されたと仮定すると(フローティングポイント オーディオの範囲は -1.0 ~ 1.0 であるため、65535 で割ると積が 96 dB 減少し、16 ビット オーディオでは聞こえなくなります)。実際にこのメソッドを実装したい場合は、署名付きデータに対してこれを行うことに関する V Toth の投稿を読んでください。
符号付きか符号なしかに関係なく、相互変調歪みが追加されます (耳障りな音ではなくても、存在します)。言い換えれば、これは音声、または伝送チャネルの歪みがチャネルの積によって追加される相互変調歪みをはるかに超える低ビットレート (電話) オーディオに最適です。
2 つのファイルを処理しているだけで、リアルタイムで処理していない場合 (ファイルまたはストリームからブロックを読み取りながら再生)、両方のファイルを正規化し、gain1+gain2 = 1.0 のような混合ゲインを適用し、合計することができます。それらを一緒に。V Toth が言及したこれらの低解像度の課題は、32 ビット float または 64 ビット double では大きな問題ではありません。
最後に、一方のソースが静かすぎてもう一方のソースが静かであることが懸念される場合は、ダイナミック レンジ コンプレッサを他のチャネルにクロスリンクして適用できます。もう 1 つの戦術は、同じアルゴリズムをオーディオのエンベロープに適用し、個々のサンプルには適用しないことです。
outEnvelope[i] = (envelope1[i] + envelope2[i]) \
-(envelope1[i])*(envelope2[i]);
outdata[i]=outEnvelope[i]*(data[i] + data2[i]);
エンベロープ =
envelope1[i]=sqrt(lowPassFilter(data[i]*data[i]));//moving RMS representation
また、ローパスフィルターのカットオフ周波数は、高調波歪みを最小限に抑えるために<10Hz程度です。
本当に、ほとんどの場合、最後の用語を削除して次の行を使用するだけでよいと思います。
outdata[i] = (data[i] + data2[i]);
channel_gain[] の合計が 1.0 である限り、良い結果が得られます。nishantmishra によるコードは、歪みを追加する最後の項がノイズ フロアに削減されるため、適切に機能するため、CPU 時間を節約して削除することもできます。