短いバージョン:ループの反復(compounds+k)->spectra->peaks
後に変化するのはなぜですか(~2500 の化合物のうちの 4 つ)?for
詳細バージョン: すべてのデータ (構造クロマトグラム ( ) 内) を調べ、新しい構造 ( )にストレートのデータchrom
を追加する機能があります。残りのデータに非常に類似したクロマトグラムがある場合は、クロマトグラムを調べて合計/平均します。の 1 エントリに。このプログラムは、当時持っていたデータセットを使用して最初に作成したときは正常に機能しましたが、最近のデータでは、スペクトル内にある「値」の数を追跡する整数が何らかの形で包含終了後に 0 にリセットされるというバグに遭遇しました。私のコードを読んだ後、それが少し明確になることを願っています(問題を示す最後の2つのプリントに特に注意してください)。type == 1
compounds
type == 2
compounds
for loop
chromatogram*
spectral_matcher(chromatogram* chrom, arguments* args) {
int i, j, k = 0, l, m, size, counter = 0;
float low_mass, high_mass, low_time, high_time;
chromatogram* compounds;
compounds = calloc(MAX_SPECTRA,sizeof(chromatogram));
for (i = 0; i < chrom->hits-1; i++) {
if ( (chrom+i)->type == 1) {
/* Adding the MS1 spectrum to output set */
chrom_copy(chrom, compounds, i, k);
k++;
} else if ((chrom+i)->used != 1 && (chrom+i)->type == 2) {
/* Adding the MSn spectrum to output set */
chrom_copy(chrom, compounds, i, k);
/* Acquiring search paramenters */
low_mass = (chrom+i)->precursor - args->mass_tolerance;
high_mass = (chrom+i)->precursor + args->mass_tolerance;
low_time = (chrom+i)->time - args->time_tolerance;
high_time = (chrom+i)->time + args->time_tolerance;
/* Performing search for matching spectra */
for (j = i+1; j < chrom->hits; j++) {
if ( (chrom+j)->type == 2 && (chrom+j)->precursor > low_mass && (chrom+j)->precursor < high_mass && (chrom+j)->time > low_time && (chrom+j)->time < high_time && (chrom+i)->spectra->peaks > 10 && (chrom+j)->spectra->peaks > 10 && (chrom+j)->used != 1) {
/* the KS test can only be performed if the previous if statement was true */
if (pdf_ks((chrom+i)->pdf,(chrom+j)->pdf, 1.0) == 1) {
if (args->verbose == 1) {
printf("Matching spectrum %i with %i into %i\n",i, j, k);
}
// De magicks - Photo Finish
counter++;
l = (compounds+k)->spectra->peaks;
size = (compounds+k)->spectra->peaks + (chrom+j)->spectra->peaks;
(compounds+k)->spectra->peaks = size;
m = 0;
/* `l` is at the end of original spectra, append values starting from `l` */
for (; l < size; l++) {
((compounds+k)->spectra+l)->mz_value = ((chrom+j)->spectra+m)->mz_value;
((compounds+k)->spectra+l)->int_value = ((chrom+j)->spectra+m)->int_value;
m++;
}
// set the 'matched' spectrum to NULL so there will be no duplicates
(chrom+j)->used = 1;
}
}
}
k++;
}
/* k was incremented in either the if or else if so doing -1 here */
printf("%i: values [ %i ] contains a value set [ %f - %f ]\n", k-1, (compounds+k-1)->spectra->peaks, ((compounds+k-1)->spectra+5000)->mz_value,((compounds+k-1)->spectra+5000)->int_value);
}
printf("BREAKPOINT\n");
printf("%i spectra summed\n",counter);
compounds->hits = k;
for (i = 0; i < compounds->hits; i++) {
printf("%i: values [ %i ] contains a value set [ %f - %f ]\n", i, (compounds+i)->spectra->peaks, ((compounds+i)->spectra+5000)->mz_value,((compounds+i)->spectra+5000)->int_value);
}
exit(0);
return(compounds);
}
前に説明したように、4 つの化合物が奇妙な動作をすることがわかっているので、出力から一致する行を次に示します。
736: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
847: values [ 16481 ] contains a value set [ 765.000000 - 5843.000000 ]
1810: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
2212: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
BREAKPOINT
736: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
847: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
1810: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
2212: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
配列内の値は、この結果に基づいて変更されているようにも見えます。
ただし、4 つの固有値の周囲の値は正しいままです。
735: values [ 44801 ] contains a value set [ 556.250000 - 0.000000 ]
736: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
737: values [ 131848 ] contains a value set [ 765.000000 - 0.000000 ]
BREAKPOINT
735: values [ 44801 ] contains a value set [ 556.250000 - 0.000000 ]
736: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
737: values [ 131848 ] contains a value set [ 765.000000 - 0.000000 ]
次に何をチェックすべきかについて、誰かが何かヒットやヒントを持っていれば、本当に感謝しています。
-- 5月16日 (4:20) --
コードi
に追加して、特定の値で for ループを手動で中断して、データがどこで変更されるかを確認してみました。if (i == 806) { break; }
これにより、次の結果が得られました。
736: values [ 16481 ] contains a value set [ 765.000000 - 0.000000 ]
BREAKPOINT
736: values [ 0 ] contains a value set [ 765.000000 - 905.625000 ]
-- 5月17日 --
i および k カウンターが何かおかしなことをしているかどうかも確認しましたが、完全に問題ないようです (for ループ内)。
I: 803 K: 734
I: 804 K: 735
I: 805 K: 736 /* The iteration which shows wrong data AFTER the for loop closes */
I: 806 K: 737
I: 807 K: 738
I: 808 K: 739