2

短いバージョン:ループの反復(compounds+k)->spectra->peaks後に変化するのはなぜですか(~2500 の化合物のうちの 4 つ)?for

詳細バージョン: すべてのデータ (構造クロマトグラム ( ) 内) を調べ、新しい構造 ( )にストレートのデータchromを追加する機能があります。残りのデータに非常に類似したクロマトグラムがある場合は、クロマトグラムを調べて合計/平均します。の 1 エントリに。このプログラムは、当時持っていたデータセットを使用して最初に作成したときは正常に機能しましたが、最近のデータでは、スペクトル内にある「値」の数を追跡する整数が何らかの形で包含終了後に 0 にリセットされるというバグに遭遇しました。私のコードを読んだ後、それが少し明確になることを願っています(問題を示す最後の2つのプリントに特に注意してください)。type == 1compoundstype == 2compoundsfor loop

chromatogram*
spectral_matcher(chromatogram* chrom, arguments* args) {
   int i, j, k = 0, l, m, size, counter = 0;
   float low_mass, high_mass, low_time, high_time;
   chromatogram* compounds;
   compounds = calloc(MAX_SPECTRA,sizeof(chromatogram));
   for (i = 0; i < chrom->hits-1; i++) {
       if ( (chrom+i)->type == 1) {
           /* Adding the MS1 spectrum to output set */
           chrom_copy(chrom, compounds, i, k);
           k++;
       } else if ((chrom+i)->used != 1 && (chrom+i)->type == 2) {
           /* Adding the MSn spectrum to output set */
           chrom_copy(chrom, compounds, i, k);
           /* Acquiring search paramenters */
           low_mass = (chrom+i)->precursor - args->mass_tolerance;
           high_mass = (chrom+i)->precursor + args->mass_tolerance;
           low_time = (chrom+i)->time - args->time_tolerance;
           high_time = (chrom+i)->time + args->time_tolerance;
           /* Performing search for matching spectra */
           for (j = i+1; j < chrom->hits; j++) {
               if ( (chrom+j)->type == 2 && (chrom+j)->precursor > low_mass && (chrom+j)->precursor < high_mass && (chrom+j)->time > low_time && (chrom+j)->time < high_time && (chrom+i)->spectra->peaks > 10 && (chrom+j)->spectra->peaks > 10 && (chrom+j)->used != 1) {
                   /* the KS test can only be performed if the previous if statement was true */
                   if (pdf_ks((chrom+i)->pdf,(chrom+j)->pdf, 1.0) == 1) {
                       if (args->verbose == 1) {
                           printf("Matching spectrum %i with %i into %i\n",i, j, k);
                       }
                       // De magicks - Photo Finish
                       counter++;
                       l = (compounds+k)->spectra->peaks;
                       size = (compounds+k)->spectra->peaks + (chrom+j)->spectra->peaks;
                       (compounds+k)->spectra->peaks = size;
                       m = 0;
                       /* `l` is at the end of original spectra, append values starting from `l` */
                       for (; l < size; l++) {
                           ((compounds+k)->spectra+l)->mz_value = ((chrom+j)->spectra+m)->mz_value;
                           ((compounds+k)->spectra+l)->int_value = ((chrom+j)->spectra+m)->int_value;
                           m++;
                       }
                       // set the 'matched' spectrum to NULL so there will be no duplicates
                       (chrom+j)->used = 1;
                   }
               }
           }
           k++;
       }
       /* k was incremented in either the if or else if so doing -1 here */
       printf("%i: values [ %i ] contains a value set [ %f - %f ]\n", k-1, (compounds+k-1)->spectra->peaks, ((compounds+k-1)->spectra+5000)->mz_value,((compounds+k-1)->spectra+5000)->int_value);
   }
   printf("BREAKPOINT\n");
   printf("%i spectra summed\n",counter);
   compounds->hits = k;
   for (i = 0; i < compounds->hits; i++) {
       printf("%i: values [ %i ] contains a value set [ %f - %f ]\n", i, (compounds+i)->spectra->peaks, ((compounds+i)->spectra+5000)->mz_value,((compounds+i)->spectra+5000)->int_value);
   }
   exit(0);
   return(compounds);
}

前に説明したように、4 つの化合物が奇妙な動作をすることがわかっているので、出力から一致する行を次に示します。

736: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
847: values [ 16481 ] contains a value set [ 765.000000 - 5843.000000 ]
1810: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
2212: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
BREAKPOINT
736: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
847: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
1810: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
2212: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]

配列内の値は、この結果に基づいて変更されているようにも見えます。

ただし、4 つの固有値の周囲の値は正しいままです。

735: values [ 44801 ] contains a value set [ 556.250000 - 0.000000 ]
736: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
737: values [ 131848 ] contains a value set [ 765.000000 - 0.000000 ]
BREAKPOINT
735: values [ 44801 ] contains a value set [ 556.250000 - 0.000000 ]
736: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
737: values [ 131848 ] contains a value set [ 765.000000 - 0.000000 ]

次に何をチェックすべきかについて、誰かが何かヒットやヒントを持っていれば、本当に感謝しています。

-- 5月16日 (4:20) --

コードiに追加して、特定の値で for ループを手動で中断して、データがどこで変更されるかを確認してみました。if (i == 806) { break; }これにより、次の結果が得られました。

736: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
BREAKPOINT
736: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]

-- 5月17日 --

i および k カウンターが何かおかしなことをしているかどうかも確認しましたが、完全に問題ないようです (for ループ内)。

I: 803  K: 734
I: 804  K: 735
I: 805  K: 736 /* The iteration which shows wrong data AFTER the for loop closes */
I: 806  K: 737
I: 807  K: 738
I: 808  K: 739
4

3 に答える 3

2

これを見てください:

chromatogram* compounds;
compounds = calloc(MAX_SPECTRA,sizeof(compound));

ということでしょうsizeof(chromatogram)か?それともcompound *compounds

于 2013-05-16T11:56:03.097 に答える
0

の値を変更することはできます(compounds+k)->spectra->peaksか?

size = (compounds+k)->spectra->peaks + (chrom+j)->spectra->peaks;
(compounds+k)->spectra->peaks = size;

size変数は であり、int問​​題に関係している可能性があります。

于 2013-05-16T15:59:08.997 に答える