次の例のような、ゲノムの塩基対の位置を含むシーケンス データファイルがあります。
chr1 814 G A 0.5
chr1 815 T A 0.3
chr1 816 C G 0.2
chr2 315 A T 0.3
chr2 319 T C 0.8
chr2 340 G C 0.3
chr4 514 A G 0.5
列 2 で見つかった bp の位置によって定義された特定のグループを比較したいと思います。次に、一致する領域の列 5 の数値の平均が必要です。
したがって、上記の例を使用して、chr1 810-820 および chr2 310-330 にまたがるすべてのサンプルの 5 番目の列の平均を探しているとしましょう。最初の 5 行を特定し、5 列目の数値を平均すると、0.42 になります。
範囲の配列を作成し、awk を使用してこれらの場所を呼び出そうとしましたが、失敗しました。前もって感謝します。