1

pcmを使用してmp3変換プログラムを作成しようとしていLameます。pcmデータはmp3ファイルに変換されますが、出力は非常にきしむ音がします。質問を投稿する前に、私が持っているコードは次のとおりです。

/*
Sample program to generate a single sinusoid and encode it in mp3.
*/

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <include/lame/lame.h>
#include <assert.h>
#include <string.h>

int main(int argc, char *argv[]) {

  unsigned int sampleRate = 16000;  /*assumed.*/
  unsigned int nSecondsAudio = 4;
  float *arr;
  lame_global_flags *gfp;
  unsigned char mp3buffer[2304]; /*some odd buffer sizes hard-coded.*/
  int pcm_samples_1d[2*1152];
  int pcm_samples_2d[2][1152];
  int read = 0, write = 0;
  int return_code = 1;
  int mp3buf_size;
  FILE *mp3;
  FILE *pcm;
  int framesize = 0;
  int i = 0, j = 0, num_samples_encoded = 0;

  /*Step 1. Generate sinusoid.*/
  /*arr = (float *) malloc(sizeof(float) * nSecondsAudio * sampleRate);
  arr = generateSinusoid(sampleRate, nSecondsAudio);*/

  /*Step 2. See if encoder exists.*/
  char *s = (char *) malloc(sizeof(char)*200);
  s = get_lame_version();
  printf("Lame version = %s\n", s);


  /* Init lame flags.*/
  gfp = lame_init();
  if(!gfp) {
    printf("Unable to initialize gfp object.");
  } else {
    printf("Able to initialize gfp object.\n");
  }

  /* set other parameters.*/
  lame_set_num_channels(gfp, 1);
  /*lame_set_num_samples(gfp, (nSecondsAudio * sampleRate));*/
  lame_set_in_samplerate(gfp, sampleRate);
  lame_set_quality(gfp, 5);  /* set for high speed and good quality. */
  lame_set_mode(gfp, 3);  /* the input audio is mono */

  lame_set_out_samplerate(gfp, sampleRate);
  printf("Able to set a number of parameters too.");
  framesize = lame_get_framesize(gfp);
  printf("Framesize = %d\n", framesize);
  assert(framesize <= 1152);

  /* set more internal variables. check for failure.*/
  if(lame_init_params(gfp) == -1) {
    printf("Something failed in setting internal parameters.");
  }

  /* encode the pcm array as mp3.*
   * Read the file. Encode whatever is read.
   * As soon as end of file is reached, flush the buffers.
   * Write everything to a file.
   * Write headers too.
  */

  /* Open PCM file for reading from.*/
  pcm = fopen("out.pcm", "rb");   /*hard-coded to the only available pcm file.*/
  if(!pcm) {
    printf("Cannot open pcm file for reading.");
    return 1;
  }

  mp3 = fopen("out.mp3", "wb+");
  if(!mp3) {
    printf("Cannot open file for writing.");
    return 1;
 }

  do {
   read = fread(pcm_samples_1d, sizeof(short), 2304, pcm); /*reads framesize shorts from pcm file.*/
   printf("Read %d shorts from file.\n", read);

   /* check for number of samples read. if 0, start flushing, else encode.*/
   if(read > 0) {
     /* got data in 1D array. convert it to 2D */
     /* snippet below taken from lame source code. needs better understanding. pcm_samples_2d[0] = contents of buffer. pcm_samples_2d[1] = 0 since number of channels is always one.*/
     memset(pcm_samples_2d[1], 0, 1152 * sizeof(int));  /*set all other samples with 0.*/
     memset(pcm_samples_2d[0], 0, 1152 * sizeof(int));
     i = 0, j = 0;
     for(i = 0; i < 1152; i++) {
       pcm_samples_2d[0][i] = pcm_samples_1d[i];
     }

     /* encode samples. */
     num_samples_encoded = lame_encode_buffer_int(gfp, pcm_samples_2d[0], pcm_samples_2d[1], read, mp3buffer, sizeof(mp3buffer));

     printf("number of samples encoded = %d\n", num_samples_encoded);

     /* check for value returned.*/
     if(num_samples_encoded > 1) {
       printf("It seems the conversion was successful.\n");
     } else if(num_samples_encoded == -1) {
       printf("mp3buf was too small");
       return 1;
     } else if(num_samples_encoded == -2) {
       printf("There was a malloc problem.");
       return 1;
     } else if(num_samples_encoded == -3) {
       printf("lame_init_params() not called.");
       return 1;
     } else if(num_samples_encoded == -4) {
       printf("Psycho acoustic problems.");
       return 1;
     } else {
       printf("The conversion was not successful.");
       return 1;
     }

     printf("Contents of mp3buffer = \n");
     for(i = 0; i < 2304; i++) {
       printf("mp3buffer[%d] = %d\n", i, mp3buffer[i]);
     }


     write = (int) fwrite(mp3buffer, sizeof(char), num_samples_encoded, mp3);
     if(write != num_samples_encoded) {
       printf("There seems to have been an error writing to mp3 within the loop.\n");
       return 1;
     } else {
       printf("Writing of %d samples a success.\n", write);
     }
   }
 } while(read > 0);

 /* in case where the number of samples read is 0, or negative, start flushing.*/
 read = lame_encode_flush(gfp, mp3buffer, sizeof(mp3buffer)); /*this may yield one more mp3 buffer.*/
 if(read < 0) {
   if(read == -1) {
     printf("mp3buffer is probably not big enough.\n");
   } else {
     printf("MP3 internal error.\n");
   }
   return 1;
 } else {
   printf("Flushing stage yielded %d frames.\n", read);
 }

 write = (int) fwrite(mp3buffer, 1, read, mp3);
 if(write != read) {
   printf("There seems to have been an error writing to mp3.\n");
   return 1;
 }

  /*samples have been written. write ID3 tag.*/
  read = lame_get_id3v1_tag(gfp, mp3buffer, sizeof(mp3buffer));
  if(sizeof(read) > sizeof(mp3buffer)) {
    printf("Buffer too small to write ID3v1 tag.\n");
  } else {
    if(read > 0) {
      write = (int) fwrite(mp3buffer, 1, read, mp3);
      if(read != write) {
        printf("more errors in writing id tag to mp3 file.\n");
      }
    }
  }

  lame_close(gfp);
  fclose(pcm);
  fclose(mp3);

  return 0;
}

私の質問:
1。入力pcmデータは16kHzでサンプリングされ、モノラルで16ビットでエンコードされています。チャネルが1つしかない場合、lame_encode_buffer_intへの入力の左右のチャネルは何ですか?
2. 1d配列から2d配列(コードではpcm_samples_1dからpcm_samples_2d)に移行する「変換」プロセスを理解しているかどうかはわかりませんが、この質問に示されています。
3.なぜきしむような声がするのですか?--enable-debugコードでは、使用されるライブラリはフラグを使用してソースからコンパイルされました。それでも、を使用する機能にステップインすることはできませんgdb。他に何をすべきでしたか?

私がこれまでに試したこと:
1。LAMEプロジェクトのドキュメント(またはネットで入手できるもの)を読みます。
2.SOや他のフォーラムに投稿された質問を読み通してください。
3.ソースコードを確認しました:lame.hfrontend/main.cfrontend/get_audio.c`など。

これに関するどんな助けでも大歓迎です。

4

3 に答える 3

1

これ:

char *s = (char *) malloc(sizeof(char)*200);
s = get_lame_version();

間違っていると、メモリリークが発生します。呼び出しを削除します。ポインタを返すmalloc()もので上書きするため、割り当てられたメモリを使用していません。get_lame_version()

また、の戻り値をCでキャストしないmalloc()でください。また、常に1であるため、避けsizeof (char)てください。ポインタ型への割り当てを「ロック」する場合は、次を使用します。

s = malloc(200 * sizeof *s);

コードについてより具体的に言うと、1d / 2d配列は非常に恐ろしいものであり、私が持っていないLAME APIの知識がなければ、そのコードが正しいかどうかを知ることは不可能です。それはそれがしているように見えるので、それはモノラル/ステレオに関連しているかもしれません。

MP3がサイレントチャネルで問題ないかどうかわからない場合は、何らかの理由で(クリックを生成する)不正な入力データである可能性があります。

于 2013-01-30T13:15:41.583 に答える
0

問題を解決するために私がしたことは次のとおりです。
で出力オーディオファイルを再生しようとしましたAudacity。そのファイルの「速度」を50%下げると、正しい出力が得られました。これは、入力と出力のサンプリングレートが異なり、リサンプリング操作が内で行われないことが問題である可能性があることを意味しますlame_encode_buffer_intlame_encode_buffer他のルーチンの中でリサンプリングを処理するルーチンを変更しました。これでエンコードが機能しました。

于 2013-02-05T12:12:29.537 に答える
0

あなたの問題は確かにLAMEが16kHzをサポートしておらず、lame_encode_buffer_int()関数がデータを自動的にリサンプリングしないという事実だったと思います。

また、出力サンプルレートを設定することもできます。

lame_set_out_samplerate(gfp, sampleRate);

MP3と互換性がない場合、問題が発生します。

有効なMP3(MPEG-1、レイヤーIII)サンプルレートは次のとおりです。

  • 32kHz、
  • 44.1kHz(LAMEはデフォルトでこれを使用します)、および
  • 48kHz。

LAMEはおそらく32kHzを選択しました。そのため、Audacityでレートを半分にすると、オーディオが完璧なレートに戻りました。


モノラル/ステレオの問題に関しては、NULLモノラルデータしかない場合は常に正しいバッファを指定しないでください(use)。これは、単一のチャネルを定義している限り機能します。

lame_set_num_channels(gfp, 1);
...snip...
lame_encode_buffer_int(gfp, pcm_samples_1d, NULL,
                       read, mp3buffer, sizeof(mp3buffer));

にはlame_encode_buffer()、適切なバッファをに設定することもできますNULL

lame_encode_buffer(gfp, pcm_samples_1d, NULL
                   read, mp3bufer, sizeof(mp3buffer));

内部的には、これは1dバッファーが両方のチャネルに使用されることを意味しますが、低レベルのサンプリングはとにかく正しいバッファーを無視します。


彼の回答で述べたように、そのコードにはLAMEに直接関係しないいくつかの問題もあります...まだそれがあり、興味があり、レビューが必要な場合は、コードレビュースタックに投稿してみてください。

于 2019-07-12T02:15:15.380 に答える